ОБУЧАЕМЫЕ НАВЫКОВЫЕ СИСТЕМЫ

Кавыгин В.В., Попиков П.И., Рубахин А.И.


    Рассмотрены архитектура и основные принципы работы обучаемых навыковых систем, изложены их достоинства. Изложен принцип автоматического формирования навыков системы, на основании которого после обучения система безошибочно определяет заданное при обучении решение или прогнозирует ближайшее (к известным) решение в ситуации, которой не обучали Обучение систем осуществляется подобно живым организмам автоматически с формированием синаптической навыковой памяти технического мозга.
    Даны описания обучаемых навыковых систем: технического зрения, диагностики гепатитов, экологического мониторинга и выбора оборудования Обучаемая навыковая система технического зрения способна определять шероховатость обработанной поверхности, узнавать человека по геометрии ладони, по лицу. Обучаемая навыковая система диагностики гепатитов определяет вид и стадию заболевания на основе данных иммунно-ферментного анализа по серологическим маркёрам. Обучаемая навыковая система экологического мониторинга воздушной среды предназначена для учёта и прогнозирования заболеваемости органов дыхания

    Обучаемые навыковые системы являются автоматическими и могут быть использованы для управления стационарными и подвижными машинами, такими как роботы, металлорежущие станки, транспортные средства, - для регулирования производственных процессов на металлургических, химических и иных установках, для анализа, прогноза и диагностики, а также в режиме советчика. Они способны принимать решения на основе зрительной, слуховой, тактильной и иной образной информации, поставляемой техническими органами чувств: глазами, ушами, чувствительной кожей и прочими органами и даже такими, каких нет у живых существ. Принимаемые решения могут выражаться в форме сигналов управления приводами машин или в виде словесно-числовых выводов, заключений и рекомендаций.
    Выбор и принятие правильного решения зависит от полноты исходной информации, методах её учёта, возможности формализации, опыта и интуиции принимающего решение. Во многих сферах человеческой деятельности задачи принятия решения связаны с учётом достаточно большого объёма исходной информации, с многовариантностью возможных решений, нечёткостью исходной информации и решений, трудноформализуемостью множества признаков ситуации в отображении на множество принимаемых решений. Каждая ситуация, образ, как правило, представляет собой многомерный нечёткий вектор, которому соответствует множество решений, в том числе и правильных. Например, в задачах медицинской диагностики в зависимости от комбинации значений исходных признаков ставится диагноз. Если количество признаков - результатов анализов составляет, к примеру, 20 и каждый из них имеет 4 уровня градаций, то количество возможных комбинаций составляет 280. Учесть все комбинации врач не в состоянии, поэтому решение принимается на основании опыта и интуиции. Количество факторов, которые должен учитывать врач может составлять и более 100 и с большим количеством уровней градаций. Как учесть это великое множество факторов и достичь некоторой определённости? В природе решения принимаются на основе навыков, опыта, приобретённых в процессе обучения.
    Обучаемые навыковые системы подобно живым организмам формируют навыки, на основании которых и принимаются решения. Навыки формируются автоматически, путём многократного итерационного обучения. Сформированные в результате обучения весовые коэффициенты - навыки аналогичны проводимостям синапсов корковых нейронов живых организмов.
    Процесс обучения сводится не к запоминанию образов ситуаций, а к формированию такой проводимости синаптической навыковой памяти технического мозга, проходя через которую рецепторная информация сразу же превращается в сигналы управления или в словесно-числовые рекомендации, заключения.
    Известно, что транспорт веществ в нервных системах упорядочен. Упорядоченность является следствием того, что каналы нейрона, соединяющие дендриты с аксонными окончаниями, автономны и внутри нейрона не пересекаются; аксон представляет собой пучок таких каналов. Под воздействием одних медиаторов поток веществ наращивает белки и увеличивает проводимость синапсов, а под воздействием других, наоборот, - отторгает белки и уменьшает проводимость синапсов. Так как поток вещества транспортируется по каналам, то эти каналы не перемешиваются. Поэтому поток вещества от рецептора идёт к вполне определённому нейрону в отличие от принятой в большинстве случаев модели нейронных сетей.

Рис. 1. Нейрофизиологическая модель формирования навыков


    Первоначально, до обучения, связи рецепторов с нейроном устанавливаются произвольно, то есть не имеет значения какой рецептор с каким нейроном соединен. После же обучения эти связи закрепляются, и изменяться не должны. В противном случае может потребоваться переобучение, длительность которого зависит от общего числа связей, количества изменённых связей и их значимости.
    Весовые коэффициенты сформированные в результате обучения имеют различные знаки и значения. Предполагается, что различные знаки весовых коэффициентов соответствуют действию возбуждающих и тормозных медиаторов в спайках дендрита в потенциал-зависимых Ca2+ и Na+ каналах.
    Процесс обучения подобен выработке условного рефлекса у животного, как и в опытах И.П. Павлова, поэтому такие системы, по сути, являются рефлекторными. Обучаемой навыковой системе предъявляется образ или ситуация, характеризуемые множеством факторов:
X = {X1, … Xn}           (1)

    Рецепторы воспринимают эти факторы-сигналы, возбуждаясь пропорционально им и собственной чувствительности. Причём для обучаемых навыковых систем стабильность характеристик рецепторов не имеет значения, что является очень важным положительным качеством системы. Ведь в обычных системах этой проблеме уделяется много внимания и не всегда её удаётся решить. Более того, нестабильность характеристик рецепторов во времени не является критической. Возбуждения рецепторов образуют множество:
B = {b1 … bn}           (2)

    Каждый нейрон формирует управляющий сигнал. Если рецепторы изменили со временем свои свойства в к-раз, то и управляющий сигнал У изменится в к-раз, что можно предусмотреть обучением:
           (3)

    где к - коэффициент пропорциональности;
    bj - возбуждения рецепторов;
    cj - весовые коэффициенты.

    Процесс обучения заключается в определении весовых коэффициентов, аналогов синапсов коры головного мозга живых существ. Согласно биогидравлической концепции [1] "кора головного мозга представляет собой матрицу со строками и столбцами: строки - нейроны, идущие от рецепторов, а столбцы - мотонейроны, идущие к мышцам; на пересечении - синапсы". Сигналы от рецепторов передаются потоками жидкости и синапсы, в зависимости от настройки, регулируют потоки, уменьшая или увеличивая проходные сечения в местах соединения аксонов с дендритами. Синапсы работают как регулируемые гидравлические дроссели.
    Обучаемая навыковая система, работающая на основе этих принципов представлена на рис.2.

Рис. 2. Структурная схема обучаемой навыковой системы

    Образ или ситуация, характеризуемые множеством факторов {Х} отражается в виде множества возбуждений рецепторов {В}. Множество {В} является подмножеством и оно составляет базу данных.
    База данных может содержать i = 1…m образов. После прохождения сигналов от рецепторов через синапсы получаем множество {У} = {y1,…yn}.
    Управляющий расчётный сигнал Ур получается алгебраическим суммированием множества {У}:
           (4)

    Управляющий сигнал поступает на исполнительный механизм (ИМ). Так работает обученная навыковая система. При предъявлении очередного образа или ситуации формируется определённый управляющий сигнал Уi и совершается требуемое действие: движение или сигнализация. Большим достоинством обучаемых навыковых систем является возможность распараллеливания процесса формирования управления. В процессе распознавания проводимость каждого синапса определяется отдельно, допуская выполнять эту операцию параллельно. Причём эта операция является простой - умножением. Поэтому распознавание или, что то же самое, принятие решения, происходит мгновенно, превосходя по быстродействию живые системы и тем более системы, реализованные на базе обычных компьютеров последовательного действия.
    В режиме обучения в системе устанавливаются связи, указанные пунктиром (Рис.2). В соответствии с очередным выбранным из базы данных образом берётся и сравнивается с расчётным Ур.
    Обучение производится без изменения структуры системы, а только подключается база знаний, содержащая коды образов или ситуаций. Из базы данных берётся очередной образ - множество {В}, а из базы навыков множество {С} и определяется множество {У}. После суммирования расчётное значение Уpi сравнивают с заданным Узi:
Δ = Узi - Уpi           (5)

    Если ошибка не превышает допуска на ошибку, то система считается обученной. В противном случае следует перерасчёт весовых коэффициентов. Расчёт ведётся по естественному алгоритму обучения [2]. Величина поправки каждого весового коэффициента Сj определяется в зависимости от ошибки и возбуждения рецептора:
           (6)

    Процесс обучения осуществляется автоматически, как правило, многократным повторением: предъявлением очередного образа, вычислением расчётного управляющего сигнала, определением ошибки, расчётом весовых коэффициентов Cj с учётом поправок, предъявлении очередного образа и т.д. Это продолжается до тех пор, пока Cj не будут равны таким значениям, при которых сумма произведений элементов любого множества {В} из базы данных на элементы множества С будет равна соответствующему коду множества из базы знаний. Обратная связь действует только во время обучения. Таким образом, формируется база навыков или точнее синаптическая навыковая память. Интересно, что при этом выявляется значимость влияния каждого исходного фактора на принимаемое решение. Так как формирование весовых коэффициентов осуществляется автоматически, то их значения отражают объективную реальность. По величине весового коэффициента можно судить о важности фактора, что позволяет давать практические рекомендации.
    Расчёт весовых коэффициентов сводится к нахождению матрицы - столбца С системы линейных уравнений:
           (7)

    Существуют разные способы решений подобных совместных систем. Одним из способов является алгоритм естественного обучения. Этот алгоритм является итерационным подобным многократному повторению ситуаций при обучении живых организмов. В нём нет, как и в живых организмах, искусственного определения среднеквадратичного отклонения, составления искусственных решающих правил и так далее. Как показала практика значения матрицы - столбца С зависят от порядка предъявления образцов при обучении, следовательно, система линейных уравнений является, с точки зрения математики, неопределённой.
    Таким образом, нейробиологическая модель навыковой системы имеет упорядоченную, лишённую хаоса, структуру, при передаче сигналов от рецепторов к нейронам.
    Формирование управляющего сигнала или принятие решения выполняется путём простых арифметических действий практически мгновенно и допускает распараллеливание процесса.
    Процесс обучения осуществляется без изменения структуры системы автоматически путём создания базы навыков подобно выработке условных рефлексов у живых организмов. Значения весовых коэффициентов характеризуют значимость факторов, что позволяет давать объективные практические рекомендации по их учёту.
    Обучаемая интеллектуальная система совмещает достоинства детерминированных и стохастических систем. В ситуациях, которым обучали система, принимает вполне определённое, чёткое решение, соответствующее решению опытных специалистов, в остальных же случаях она формирует вероятное нечёткое решение, ближайшее к известным.
    Нейрофизиологическая концепция, оказалась плодотворной и позволила создать на её основе работоспособные технические обучаемые системы управления. Роботы, оснащённые такими системами со зрением, продемонстрировали способность обучаться и вырабатывать навыки. Навыковая система заменила ЧПУ, и роботы стали не программируемыми, а обучаемыми, способными находить предметы любой сложной формы, ориентированные произвольно среди прочих предметов.
    При обучении, весовые коэффициенты, составляющие базу навыков, изменяются в зависимости от силы стимула - возбуждения входного сигнала рецептора (градуальные сигналы). Роль зрительного рецептора выполняют фотоэлементы устройства ввода зрительной информации - цифровой видео- или фотокамеры. Обучение осуществляется автоматически, итерационно.
    Обучаемые навыковые системы обладают рядом достоинств:
  1. простой и надёжный алгоритм обучения;
  2. возможность автоматического обучения с заданной точностью;
  3. высокая скорость обучения;
  4. практически мгновенное распознавание изображений и принятие решений (мкс);
  5. безразличие к сложности изображений;
  6. количество учитываемых факторов практически не ограничено (несколько десятков миллионов);
  7. способность определять похожие изображения;
  8. выявление характерных особенностей изображения, по весовым коэффициентам;
  9. способность системы распознавать изображения в условиях неполной информации;
  10. высокая надёжность системы - при отказе части рецепторов способность распознавания сохраняется;
  11. структура системы позволяет распараллеливать процесс обучения и распознавания, тем самым есть возможность повышать быстродействие системы;
  12. структура системы неизменна для обработки разных изображений;
  13. размер базы навыков не зависит от количества изображений, что позволяет использовать систему в качестве архиватора изображений;
  14. система позволяет без изменения структуры изменять количество учитываемых признаков, обучать, дообучать и переобучать систему;
  15. система совмещает достоинства детерминированных систем при распознавании изображений, которым обучали и стохастических систем при распознавании изображений, которым не обучали;
  16. процесс обучения системы осуществляется автоматически подобно выработке условных рефлексов живыми организмами;
  17. система способна самостоятельно определять противоречивые ситуации;
  18. обучение осуществляется на основании фактических данных и с заданной точностью полностью им соответствует;
  19. работа с обучаемыми навыковыми системами не требует знаний программирования: обучение, переобучение производятся без изменения структуры системы. Предусмотрена возможность увеличения и уменьшения количества признаков.

    Примерами обучаемых навыковых систем являются: система технического зрения, система диагностики гепатитов, система экологического мониторинга и система выбора оборудования.
    Обучаемая навыковая система технического зрения способна определять шероховатость поверхности (распознавания 8-битовых изображений, глубина цвета 8, 256 оттенков серого цвета).
    Определение шероховатости производится методом сравнения, аналогично визуальному определению шероховатости поверхности опытным специалистом. "Опытным специалистом" в данном случае является обученная навыковая система. Свет отражённый каждой точкой наблюдаемой поверхности анализируется системой и на основе навыков определяется значение шероховатости. Интенсивность отражённого элементами поверхности света зависит от параметров шероховатости. Чем грубее обработана поверхность, тем заметнее разность диффузного отражения света.
    Изображение поверхности, полученное с помощью сканера, цифровой фотокамеры или других оптических приборов, является растровым, то есть состоящее из точек (пикселей), каждая из которых несёт информацию об интенсивности отражённого света в этой точке. Эта информация, записанная в формате bmp, считывается и производится определение значения шероховатости Ra на основе базы навыков, сформированной в результате обучения системы по аттестованным образцам шероховатостей. Аттестованные образцы имели значения Ra: 0,4; 0,8; 1,6; 3,2; 6,3; 12,5 мкм. Сканирование производилось с разрешением 1200 dpi (1200 точек на дюйм - dot per inch).
    Аналогично обучаемая навыковая система технического зрения способна определять (узнавать) человека по геометрии ладони, лицу.
    Промышленные роботы ТУР-10К, PUMA, оснащённые обучаемой навыковой системой технического зрения, в отличие от программируемых, отыскивали предметы любой формы среди прочих, способны отслеживать любую траекторию по следу, преследовать подвижные цели или уклоняться от них.
    Обучаемые навыковые системы технического зрения позволяют не программировать с помощью интерполяторов движение по заданной траектории, а двигаться по ней в результате обучения опорным ситуациям. Эти возможности демонстрируются на дисплее компьютера стробоскопической имитацией движения объектива обучаемой навыковой системы технического зрения при написании цифр, движении по заданной траектории, уклонении от препятствий.
    Обучаемая навыковая автоматизированная система диагностики на основе иммунно-ферментного анализа гепатитов по 22 серологическим маркёрам, имеющим 4 уровня градаций: HBV-ДНК; HBS-Ag; HBe-Ag; AntiHBe сум; AntiHBsAg и так далее. Система обучена на основании медицинских карт вылеченных пациентов. Таким образом осуществляется обучение системы знаниям опытных лечащих врачей. Эти знания можно дополнять данными из новейших публикаций. Система способна определять и прогнозировать вид заболевания и его стадию: ВГВ-инкубация, ВГВ-репликация HBV, B и D (HBV и HDV - коинфекция) - инкубация, HDV - суперинфекция у носителя HBsAg - инкубация и так далее - 36 диагнозов. Сформированные в результате автоматического обучения навыки позволяют объективно судить о влиянии каждого серологического маркёра на полученный диагноз и его суммарное влияние. Информация о степени влияния серологических маркёров выводится на экран или печать в цифровом и графическом виде.
    Информационная навыковая система мониторинга воздушной среды предназначена для учёта и прогнозирования заболеваемости органов дыхания. В качестве исходной информации используются метеорологические данные и данные о техногенных загрязнителях. Соответствующая информация о заболеваемости органов дыхания составляют базу знаний. В результате автоматического обучения формируется базаа навыков, позволяющая объективно оценить влияние каждого фактора на заболеваемость органов дыхания. Математическая модель разрабатывается на основе нейросетевых подходов, учитывающих многофакторность, нечёткость критериев и трудноформализуемость информации. Вычислительные возможности навыковой системы обработки информации базируются на теореме Колмогорова, устанавливающей достаточность операции взвешенного суммирования и нелинейных функций одного переменного для реализации функций многих переменных. Система способна учитывать практически неограниченное количество исходной информации. С увеличением количества информации повышается точность прогнозирования. Применение обучаемой интеллектуальной системы даёт возможность выявить влияние выбросов на заболеваемость детей в целом и каждого фактора в отдельности.

Выводы

    Обучаемые навыковые системы способны учитывать практически неограниченный объём исходной, трудноформализуемой информации, вырабатывать навыки, на основе которых принимать и прогнозировать адекватные решения. Они толерантны по отношению к избытку и недостатку информации, проявляют надёжность схожую с надёжностью живых организмов, у которых отказ ряда рецепторов, синапсов и других элементов, участвующих в принятии решений, не приводят к утрате этих функций, а только несколько ухудшают их.
    Обучаемые навыковые системы перспективны для практического применения в различных сложных информационных и управляющих технических системах.
Список литературы
  1. Антонов В.М. Обучаемые системы управления / В.М. Антонов - Липецк: ЛГТУ, 1998. - 415 с.
  2. Кавыгин В.В. Алгоритм естественного обучения / В.В. Кавыгин, В.П. Морозова / Прогрессивные технологии и оборудование в машиностроении и металлургии: Сборник материалов Всероссийской научно-технической конф. Липецк: ЛГТУ, 2002, 184 с.