Применение ДСМ-метода в задачах адаптивного поведения роботов

Д.А. Добрынин


    Рассматриваются вопросы моделирования некоторых форм адаптивного поведения на базе универсального мобильного миниробота, созданного в рамках проекта "Адаптант-2005". Рассматриваются вопросы индуктивной адаптации поведения робота на базе динамического ДСМ-метода.

    Искусственным интеллектом, или ИИ (Artificical Intelligance - AI), называют процесс создания машин, которые способны действовать таким образом, что будут восприниматься человеком как разумные. С момента своего возникновения в 50-е годы ХХ столетия, ИИ переживал взлеты и падения, нарастание и угасание интереса к нему. Искусственный интеллект оказалась классическим примером технологии, которая изначально казалось простой, но при более внимательном исследовании выяснилось, насколько она сложна. Объясняется это тем, что поставленные изначально задачи оказались значительно более сложными, требующими создания совершенно иных моделей, методов и технологий. И прежде всего - технологий искусственного интеллекта. В любом случае ИИ обладает таким потенциалом для изменения окружающего нас мира, которого нет ни у одной другой технологии.
    Технологии искусственного интеллекта всегда были тесно связаны с робототехникой. Создание роботов - машин, способных действовать как человек, является общей главной целью этих наук. После впечатляющих успехов, достигнутых во второй половине двадцатого века при успешном внедрении промышленных роботов в процесс автоматизированного производства, в настоящее время можно говорить о переносе центра научных исследований в область создания автономных роботов. Здесь нужно упомянуть космических роботов для изучения поверхности небесных тел Солнечной системы, роботов для подводных исследований. В ходе борьбы с терроризмом возникла острая необходимость в роботах, предназначенных для разминирования подозрительных предметов в местах скопления людей. Нужны "умные" роботы, которые могут без помощи оператора тушить пожары, самостоятельно передвигаться по заранее неизвестной пересеченной местности, выполнять спасательные операции во время стихийных бедствий, технологических аварий и т.п.
    В настоящее время подавляющее большинство работ в области создания моделей поведения, использование методов ИИ для управления различными объектами имеют в основном теоретический, абстрактный характер. Причины тому много, одной из них является кажущаяся трудоемкость и дороговизна проектов, работающих с реальными техническими устройствами. В ходе реализации проекта "Адаптант-2005" (см. [Добрынин и др., 2005], [Добрынин, Карпов, 2005]) был создан универсальный мобильный робот "Амур", являющийся полигоном для отработки и демонстрации различных алгоритмов и методов управления. В настоящей работе речь идет о реализации на базе созданного устройства некоторых простейших формах адаптивного поведения, начиная с моделирования условно-рефлекторного поведения и заканчивая применением эволюционного моделирования и ДСМ-метода для решения конкретных робототехнических задач.
    Миниробот представляет собой автономную тележку, имеющую на борту программируемый контроллер, набор различных датчиков, исполнительные механизмы (эффекторы), радиоканал или другие модули связи с управляющим компьютером. Робот построен по модульному принципу, что позволяет использовать его компоненты для других разработок. Кроме того, архитектура робота изначально планировалась открытой для реализации на его основе разнообразных моделей поведения, решения широкого круга исследовательских задач.
      

Рис.1. Архитектура системы и внешний вид робота


    Вычислительные ресурсы робота невелики: тактовая частота микроконтроллера ATMega162 - 7 МГц, флэш-память для хранения программного кода - 16 K, ОЗУ - 512 байт.

    Классификацию входных сигналов можно осуществлять с помощью ДСМ метода [Финн, 1991]. ДСМ-метод автоматического порождения гипотез получил свое название в честь известного британского философа и экономиста Джона Стюарта Милля. В 1843г. вышла его книга "A System of Logic Ratiocinative and Inductive", в которой были изложены некоторые принципы индуктивной логики. Новый подход к индуктивной логике был сформулирован профессором В.К. Финном в начале 80-х гг.
    ДСМ-метод автоматического порождения гипотез является теорией автоматизированных рассуждений и способом представления знаний для решения задач прогнозирования в условиях неполноты информации. В отличие от классического ДСМ метода, который работает с замкнутым множеством исходных примеров и заранее определенными их свойствами, динамический ДСМ метод позволяет работать в открытой среде с неизвестным заранее количеством примеров.
    Множество обучающих примеров - это множество пар вида
E={ei}={(Xi,ui)},
где Xi - вектор сигналов рецепторов, ui - вектор управления (состояние исполнительных механизмов). Элементы векторов сигналов и управления представляются парами двоичных значений:
включено = {01}, выключено = {10}

    Такое представление необходимо для корректного выполнения операций пересечения и вложения над битовыми строками. На рис. 13 представлено одно из возможных представлений, которое было использовано для обучения движения по полосе.

    Рис. 13 Структура обучающих примеров и гипотез
    Гипотезы представляются в виде множества пар вида:
G={gi}= {{xi,yi}},

    где xi - часть вектора сигналов рецепторов, yi - требуемый вектор управления (необходимое действие).
    Динамический ДСМ работает в двух режимах:
    В режиме обучения для формирования обучающих примеров используется внешний алгоритм - так называемый "учитель". Данный алгоритм получает на вход информацию от рецепторов и вырабатывает управляющие сигналы, необходимые для адекватного поведения робота. Совокупность сигналов рецепторов и выработанных для них управляющих воздействий определяет один обучающий пример. Этот пример проверяется на уникальность и заносится ДСМ системой в базу фактов. После занесения каждого нового примера во множество обучающих примеров производится поиск гипотез. Для данной задачи использовался простой ДСМ метод без запрета на контрпримеры, поскольку нет отрицательных обучающих примеров [Кузнецов, 1991].
    Полученное множество гипотез {gi} будет содержать все возможные пересечения (общие части) обучающих примеров. Далее среди них отбираются минимальные гипотезы, то есть такие, которые вкладываются в остальные. Тем самым количество "полезных" гипотез резко сокращается. Полученные минимальные гипотезы проверяются на уникальность и заносятся в базу знаний.
    Обучение должно производиться до тех пор, пока база знаний не перестанет пополняться новыми гипотезами. Очевидно, что в этом случае обучающий алгоритм перебрал все возможные варианты входных воздействий, на которые он способен реагировать, и можно считать, что база фактов {ei} достаточно полна.
    В рабочем режиме ДСМ система получает на вход сигналы рецепторов, из которых формируется тестовый вектор. Принятие решения происходит путем проверки вложения гипотез в этот вектор. Если в тестовый вектор сигналов рецепторов вкладывается гипотеза, то робот должен действовать в соответствии с ней. Если же ни одной гипотезы не найдено, то это неизвестное состояние, для которого нужно сформировать случайный вектор управления (или ничего не делать, например).
    Если база фактов полна, то характер поведения робота в рабочем режиме под управлением ДСМ системы ничем не должен отличаться от управления "учителем". Проведенные эксперименты с минироботом "Амур" подтверждают этот факт.
    На рис. 14 представлен пример простого обучающего алгоритма для движения по темной полосе. Данный алгоритм использует фотодатчики 2 и 3 для отслеживания края полосы.

Рис. 14 Пример обучающего алгоритма для движения по полосе


    В результате работы обучающего алгоритма на тестовом полигоне было получено 16 обучающих примеров. Данный набор примеров (таблица 1) является полным, поскольку охватывает все возможные комбинации значений фотодатчиков.
Таблица 1.

Таблица 2

    В результате пересечения обучающих примеров были получены три минимальные гипотезы (таблица 2). Хорошо видно, что среди этих гипотез присутствуют только те, которые используют фотодатчики 2 и 3. Управляющие воздействия, вырабатываемые с помощью этих гипотез, полностью соответствуют тому, что дает обучающий алгоритм.

Литература
  1. Финн В.К. Правдоподобные рассуждения в интеллектуальных системах типа ДСМ //Итоги науки и техники. Сер. "Информатика". Т. 15. - М.: ВИНИТИ, 1991. - С. 54-101.
  2. Кузнецов С.О. ДСМ-метод как система автоматизированного обучения // Итоги науки и техники. Сер. "Информатика". Т. 15. - М: ВИНИТИ, 1991. - 17-53.
  3. Карпов В.Э. Эволюционное моделирование. Проблемы формы и содержания //Новости искусственного интеллекта №5, 2003
  4. Добрынин Д.А., Карпов В.Э. Моделирование некоторых простейших форм поведения: от условных рефлексов к индуктивной адаптации //Сб. научных трудов I Международной конференции "Системный анализ и информационные технологии САИТ-2005", М.: КомКнига, Т.1, стр. 188-193
  5. Добрынин Д.А., Карпов В.Э., Мещерякова Т.В., Степанов С.Н. Адаптивный мобильный робот //Мобильные роботы и мехатронные системы: Материалы научной школы-конференции, Москва, 21-25 марта 2005. Часть 1. М.: Изд-во Моск. ун-та, 2005., стр. 137-143