![]() |
|
|
Реферат: Нейросетевая реализация системыТаблица 1.5.3 Отрицание 2. Моделирование среды. Для экспериментальной проверки метода автономного адаптивного управления необходимо создать математическую модель среды, достаточную для имитации реакции и поведения реальной среды на некотором уровне, приемлемом для данной управляющей системы. Но проверка является не единственной задачей, решаемой с помощью модели среды. Во-первых, если на начальном этапе в базе знаний УС нет знаний, ее необходимо наполнить начальными данными. Возможны случаи, когда получение исходных знаний невозможно во время реальной работы УС, поскольку оно происходит методом проб и ошибок и существует реальная угроза гибели всей системы. Поэтому начальное обучение в таких случаях необходимо проводить “на стенде”, т.е. с моделью среды. Естественно, чем ближе модель к свойствам реальной среды, тем лучше обучится УС и тем выше вероятность выживания системы. Моделировать среду можно множеством способов. Например, сделать макет объекта управления, поместить его в условия, близкие к тем, где он предназначен работать и дать ему возможность обучаться, пока у экспериментаторов не будет уверенности в живучести аппарата и в способности к адаптации в том диапазоне внешних условий, где он предназначен работать. Но на пути создания реальной действующей системы возможно несколько промежуточных этапов. Представим, что система создается “с нуля” и известна только некоторая априорная информация о среде и, возможно, какие-то представления о законах управления. Создавать сразу действующий макет дорого, поскольку на данном этапе даже не известно, какие образы УС должна уметь распознавать, и, возможно, придется делать несколько эспериментальных прототипов. Для исследования данного вопроса предлагается смоделировать среду, например, с помощью ЭВМ. Как одну из моделей среды для исследований свойств ААУ мы предлагаем взять конечный автомат [КА]. КА является широко известным, хорошо изученным, понятным и удобным при моделировании среды объектом по следующим соображениям: 1) различные состояния среды естественным образом отображаются в состояния КА; 2) переходы из одного состояния среды в другое под воздействием УС и других объектов естественным образом отображаются в переходы КА между состояниями при чтении входного слова. Отметим, что среди известных и распространенных КА наиболее подходящими для модели являются автоматы Мура и недетерминированные автоматы Рабина-Скотта или НРС-автоматы. Правда, модели, основанные на первых, нуждаются в дополнительном введении стохастических источников, а НРС-автоматы нуждаются в модификации, поскольку реальные среды являются недетерминированными объектами. Более того, недетерминированность модели среды необходима для обучения УС. В самом деле, если бы реакция среды была полностью детерминированной и зависела только от воздействий на нее УС, то УС, найдя первый закон управления, использовала бы только его при выборе управляющих воздействий, так как по критериям системы управления лучше использовать хоть какой-нибудь закон управления и получить относительно гарантированный результат, чем продолжать поиски методом проб и ошибок. Получился бы замкнутый порочный круг: система воздействует на среду только одним способом, среда детерминированно реагирует на это воздействие, УС видит только одну реакцию (которая может быть не самой лучшей) и пытается вызвать только эту реакцию. Избежать таких “зацикливаний” можно посредством моделирования недетеминированной реакции среды. Приведем определение автоматов Мура [КА] и введем модифицированные НРС-автоматы. Определение 2.1. (Конечный) автомат Мура есть
пятерка А = (Z, X, Y, f, h). Здесь Z
– множество состояний, X – множество входов, Y – множество
выходов, f – функция переходов, Автомат работает по следующему принципу. Если КА находится в
некотором состоянии Определение 2.2. (Конечный) модифицированный
недетерминированный автомат Рабина-Скотта (МНРС) есть семерка А = (Z,
X, T, S, F, h, p). Здесь Z и X
– конечные множества (состояний и входов соответственно; X называют
также входным алфавитом автомата А);
Отметим, что мы рассматриваем только неалфавитные
МНРС, т.е. КА, у которых нет переходов для пустого слова Отличие принципа действия МНРС от автомата Мура состоит в том, что, когда автомат находится в некотором состоянии и прочел входное слово, то реализуется один из возможных из данного состояния и при данном входном слове переход, при этом вероятность реализации перехода определяется функцией p. Приведенные две модели среды с двумя разными КА не являются эквивалентными и задают разные модели поведения. Очевидно, что любая модель с автоматом Мура может быть смоделирована моделью с МНРС, причем обратное утверждение для любой модели неверно. Автомат Мура проще в реализации и исследованиях, а с помощью МНРС можно построить более точную модель среды. 3. Аппарат формирования и распознавания образов. 3.1. Биологический нейрон. На рис. 3.1.1, взятом из [Turchin] представлен в упрощенном виде биологический нейрон. Схематично его можно разделить на три части: тело клетки, содержащее ядро и клеточную протоплазму; дендриты – древовидные отростки, служащие входами нейрона; аксон, или нервное волокно, - единственный выход нейрона, представляющий собой длинный цилиндрический отросток, ветвящийся на конце. Для описания формальной модели нейрона выделим следующие факты: Рис. 3.1.1 В любой момент возможны лишь два состояния волокна: наличие импульса и его отсутствие, так называемый закон “все или ничего”. Передача выходного сигнала с аксона предыдущего нейрона на дендриты или прямо на тело следующего нейрона осуществляется в специальных образованиях – синапсах. Входные сигналы суммируются с синаптическими задержками и в зависимости от суммарного потенциала генерируется либо нет выходной импульс – спайк. 3.2. Формальная модель нейрона. Впервые формальная логическая модель нейрона была введена Маккалоком и Питтсом в 1948 году [Маккалок] и с тех пор было предложено огромное количество моделей. Но все они предназначены для решения в основном задач распознавания и классификации образов. Можно указать целый ряд основных отличий предлагаемой в данной работе модели и уже существующих. Во-первых, в классических моделях всегда присутствует “учитель” или “супервизор”, подстраивающий параметры сети по определенному алгоритму, предлагаемый же нейрон должен подстраиваться “сам” в зависимости от “увиденной” им последовательности входных векторов. Формально говоря, при работе нейрона должна использоваться только информация с его входов. Во-вторых, в предложенной модели нет вещественных весов и взвешенной суммации по этим весам, что является большим плюсом при создании нейрочипа и модельных вычислениях, поскольку целочисленная арифметика выполняется всегда быстрее, чем рациональная и проще в реализации. Главное же отличие предлагаемой модели состоит в цели применения. C помощью нее решаются все задачи управляющей системы: формирование и распознавание образов (ФРО), распознавание и запоминание закономерностей (БЗ), анализ информации БЗ и выбор действий (БПР), в отличии от классических моделей, где решается только первая задача. Важной задачей ФРО для автономных систем также является не только распознавание образов, но и их хранение или запоминание. Это следует из автономности системы, т.к. для неавтономных систем распознанные образы могут храниться и использоваться вне системы. Вообще говоря, проблему запоминания можно решить множеством способов. Например, один из известных способов – организовать кольцо из нейронов, в котором сигнал мог бы прецессировать до бесконечности или в течении некоторого времени в случае затухания. В последнем случае система приобретает новое полезное свойство “забывчивости”, которое, как известно, присуще биологическим системам и позволяет более рационально и экономно использовать ресурсы, т.к. ненужная или малоиспользуемая информация просто “забывается”. Эксперименты проводились с формальной моделью без памяти, но очевидно, что она нужна. Нами предлагается ввести так называемую синаптическую память, т.е. способность запоминать входной сигнал в синаптическом блоке. В данной работе мы используем нейрон из [Жданов2], который модифицирован в соответствии с [Братищев]. Мы приведем лишь краткое описание. На рис. 3.2.1 представлена блочная схема предлагаемой формальной модели нейрона. Входы нейрона xit подаются на блоки задержки Di для задержки сигнала на время Di , а затем на триггерные элементы Ti для удлинения сигнала на величину ti . Данные элементы обеспечивают некоторую неопределенность момента поступления входного сигнала по отношению к моменту генерации выходного спайка и образуют таким образом синаптическую память, поскольку входной сигнал запоминается в этих элементах на некоторое время. С учетом задержек Di и ti получаем, что, если на выходе обученного нейрона в момент t появился единичный сигнал, то единичные импульсы на входы нейрона поступили в интервалы времени di = [ t - ti - Di ; t - Di -1]. Неопределенность моментов поступления входных импульсов будет тем меньше, чем меньше задержки ti. Пример временной диаграммы работы обученного нейрона с двумя входами и с заданными задержками Di и ti иллюстрирует рис. 3.2.2. Вопросительными знаками показаны неопределенности моментов прихода входных импульсов, соответствующие интервалам di. Различное отношение и расположение задержек Di и ti во времени наделяет нейрон возможностями формирования и распознавания образов следующих видов. Если Если Если " ti = 1, то имеем пространственно-временной образ (ПВО), в этом случае однозначно определено, по каким входам и в какие моменты времени приходили сигналы. Примером может быть распознавание музыкального тона определенной высоты. Элемент lw предназначен для набора статистики по данному пространственно-временному образу. Значение lw=1 указывает на то, что данный нейрон обучен. Задержки Di и ti заданы изначально, т.е. являются константными параметрами нейрона. Если поступающая на данный нейрон последовательность сигналов содержит закономерность, описываемую такими временными параметрами, то нейрон сформирует образ такого пространственно-временного прообраза. Очевидно, что необходимое число нейронов такого типа в сети будет тем меньше, чем больше априорной информации о временных характеристиках прообразов известно на стадии синтеза сети. Приведем формализм нейрона.
Owt+1 = cwt+1 & Swt+1 ; cwt+1 = bwt+1 & lwt+1 ; bwt+1 = yit = ù cwt & ait ; ait = где lw t = Nw0 = 0; Nwt = Nwt-1 + bwt ; Rw(Nwt) - убывающая сигмоидальная функция. 3.3. Задача построения ФРО. Для того, чтобы более правильно и экономно построить нейронную сеть ФРО, необходимо понять смысл или “концепцию” [Turchin] формируемых образов, т.е., более точно выражаясь, найти для данного образа множество обучающих входных фильмов или множество всех таких реализаций входных процессов, которые приводят к обучению данного нейрона или формированию данного образа. Введем понятие обучающего входного фильма. Определение 3.3.1. Всякий входной фильм Таким образом, задачу построения НС ФРО можно сформулировать
следующим образом: для данной совокупности входных фильмов построить такую
сеть, в которой бы присутствовали нейроны, для которых данные входные фильмы
являются обучающими. Построенная таким образом сеть способна решать эталонную
задачу классификации, где в качестве эталонов используются данные входные
фильмы. Известно множество способов конструирования и настройки сетей для
классических формальных моделей нейронов, например, сети обратного распространения,
использующие обобщенное Можно иначе сформулировать задачу построения ФРО. Приведем
пример с системой “Пилот” [Диссер, Жданов9]. В математической модели спутника
используются величины углового положения спутника 3.4. Распознавание пространственно-временных образов. Определение 3.4.1. Всякую совокупность значений
реализации входного процесса в некоторые выбранные интервалы времени Отметим, что один нейрон способен распознавать (т.е. способен обучиться выделять конкретный ПВО среди всех остальных) только те ПВО, у которых единичное значение сигнала для каждой выбранной компоненты входного процесса встречается не более одного раза (пример изображен на верхнем графике рис. 3.4.1). Сеть нейронов можно построить так, что в ней будут формироваться любые заданные ПВО (нижний график рис. 3.4.1). Рис 3.4.1. 4. База знаний. Процесс накопления знаний БЗ в рамках методологии ААУ подробно рассмотрен в [Диссер], [Жданов4-8]. В данном разделе мы опишем лишь основные отличия от указанных источников. Рассмотрим общий алгоритм формирования БЗ. Основная цель алгоритма состоит в накоплении статистической информации, помогающей установить связь между выбранными управляющей системой воздействиями на среду и реакцией среды на эти воздействия. Другая задача алгоритма состоит в приписывании оценок сформированным образам и их корректировки в соответствии с выходным сигналом блока оценки состояния. Определение 4.1. Будем называть полным
отсоединением ФРО от среды следующее условие: процессы Определение 4.2. Назовем временем реакции среды на
воздействие Другими словами, время реакции среды это время, через которое проявляется, т.е. может быть распознана блоком ФРО, реакция на воздействие. Пример 4.1. Определение 4.3. Назовем минимальной Заметим, что Введем совокупность образов
Параметр n > 0 назовем запасом на инертность
среды. Смысл
смысл которого совпадает со смыслом |
|
|||||||||||||||||||||||||||||
![]() |
|
Рефераты бесплатно, реферат бесплатно, курсовые работы, реферат, доклады, рефераты, рефераты скачать, рефераты на тему, сочинения, курсовые, дипломы, научные работы и многое другое. |
||
При использовании материалов - ссылка на сайт обязательна. |