Робот-бармен и два робота-официанта
В Лаборатории компьютерных наук и искусственного интеллекта (Computer Science and Artificial Intelligence Laboratory) Массачусетского технологического института разработали принципиальный метод координации действий нескольких роботов. Метод основан на модели планирования совместной деятельности в условиях стохастичности, неопределённости и ограниченных коммуникаций (научная работа, pdf).
Алгоритм планирования совместных действий базируется на общей модели MacDec-POMDP, но использует правила действий, представленные в виде конечных операторов (finite-state controller), а не ищет правила в заданном заранее дереве решений, как это обычно принято.
На видео показано, как похожие на коробки на колёсах роботы-официанты ездят по офису и предлагают людям выпивку. Желающие получить пиво нажимают кнопку на теле робота. Официант запоминает местоположение страждущего на карте помещения и уезжает.
Официант едет к роботу-бармену — это модель PR2 производства Willow Garage (выпускается с открытым программным обеспечением). Тот кладёт баночку охлаждённого напитка в ёмкость для транспортировки на корпусе официанта — и мобильный робот возвращается по записанным координатам. При этом он может захватить с собой заказ, принятый другим роботом-официантом в той же комнате.
Авторы научной работы считают, что конечные операторы описывают действия гораздо точнее и лаконичнее, чем дерево решений. Такие описания легче интерпретировать, и они допускают работу в «бесконечном горизонте» возможных действий. Разработанный алгоритм поиска необходимых действий требует существенно более простого симулятора, который моделирует только результат работы заданного набора моторов. Таким образом, новый алгоритм способен решать гораздо больший набор проблем, чем существующие планировщики MacDec-POMDP.
Группа исследователей из Массачусетского технологического института усовершенствовала марковский процесс принятия решений (MDP). Он служит математической основой для того, чтобы смоделировать принятие решения в ситуациях, где результаты частично случайны.
Деятельность робота-бармена и роботов-официантов является демонстрацией того, что новый метод координации действий и принятия решений подходит для использования в практических задачах. В данном случае окружающая среда постоянно изменяется. Люди могут находиться в разных местах и меняют своё местоположение, что не мешает функционированию роботизированной «пивной команды».
Такие же принципы подходят для координации действий других групп роботов. Например, групп спасателей, пожарных, санитаров или полицейских.
Комментарии (5)
Raegdan
15.08.2015 15:11В таком виде сгодится только для бесплатного пива. А то так и представляю: заказываю пиво, кидаю в робота доллар, сосед пишет IM в соседний кабинет, оттуда крик: «Джонни, компилятор ругается, помоги плиз!» Робот привозит пиво
пустому креслумоему креслу, в которое сел сосед :)
Darth_Biomech
15.08.2015 21:08Картинка с картой квартиры напомнила мне о идее заставить свою Румбу записывать карту помещения и определять свое положение в комнате, с целью того чтобы он убирался более целенаправленно, менее хаотично и не врезался со всего маху в мебель, невидимую в ИК (чтобы помнил о координатах с постоянными столкновениями).
serafims
Немного странная задача использована для демонстрации алгоритма, кажется она слишком простой — ездить, как румба-пылесос, да ждать нажатия на кнопку. Вот если бы задача была бы толпе роботов наблюдать зал, и в случае поднятия руки — решить, кто поедет к человеку — было бы интересней.
gwer
Ехал бы тот, кто ближе к человеку с учетом очереди задач. Не думаю, что в этой задаче оптимизации нашлось бы что-то новое из того, что не решается давно придуманными алгоритмами.
Хотя описание задачи, приведенной в посте, явно потеряло какие-то важные детали. О какой неопределенности идет речь? Как происходит обмен информацией между роботами? Если при нажатии кнопки заказ «по воздуху» поступает в централизованную очередь заказов, то сложность задачи не ясна. Первый робот, который подъезжает к бармену за пивом в определенную комнату, забирает все пиво, которое ждут в той комнате.
Вероятно, они обмениваются информацией только при контакте (причем, например, только с барменом). Но тогда официант подъезжает к бармену, забирает одну банку и везет туда, где взял заказ. Возможность одновременной доставки нескольких заказов могла бы быть только при одновременном возвращении двух роботов из одной комнаты.
Остается вариант, что все эти роботы кружат-кружат-кружат по комнатам, собирают пачки заказов, а по возвращении носят заказы отдельно для каждой комнаты. То есть очередь заказов остается. Но при таком раскладе не лучше бы было разделить между роботами зоны ответственности (за каждым официантом закреплены отдельные столы) с попутной реализацией распределения нагрузки?