Армейская исследовательская лаборатория США (ARL) рассказала о попытках разработки алгоритма, который позволит военным управлять крупными скоплениями дронов в реальном времени. Армия США надеется, что это поможет ей добиться превосходства на поле боя. Кроме того, метод может быть полезен в разведке или при защите важных военных и гражданских объектов.
«Поиск оптимального способа наведения в режиме реального времени для этих машин — это ключевое требование для повышения тактической ситуационной осведомленности бойцов. Это позволит армии США доминировать в сложной обстановке», — считает Джемин Джордж, сотрудник Командования по развитию боевых возможностей США.
Джемин Джордж и его коллеги разработали метод управления большими скоплениями дронов на основе иерархического обучения с подкреплением (HRL). Как указывает издание The Register, скопление обученных беспилотных аппаратов можно будет отправлять в определенные области, снабдив их набором инструкций. При этом «стая» дронов будет автоматически поддерживать «строй» и выполнять приказы. Таким образом, диспетчерам-людям не придется беспокоиться об отдельных дронах и наземных транспортных средствах — достаточно будет указать группе роботов определённое место на карте. Машины, как команда, отправятся туда, куда им прикажут, и будут работать вместе как одна боевая единица.
«Использование иерархического обучения с подкреплением позволит нам контролировать скопления беспилотных летательных и наземных транспортных средств, чтобы они могли оптимально выполнять различные виды миссий», — указал Джемин Джордж.
Сотрудники лаборатории надеются, что в будущем автономные наземные роботы и летающие дроны смогут без вмешательства человека работать вместе и исследовать землю и небо.
«Скопления роботов могут использоваться для постоянного наблюдения и разведки в густонаселенной городской местности, а также для защиты периметра военной базы или ценных активов», — отметил эксперт.
Обучение с подкреплением представляет собой один из способов машинного обучения, в ходе которого ИИ обучается, взаимодействуя со средой. Иерархическое обучение с подкреплением позволяет ИИ использовать не только элементарные действия, но и подпоследовательности, выученные ранее, при работе с предыдущей задачей.
«У каждого агента свой собственный цикл обучения с соответствующим вознаграждением. Мы смогли значительно сократить время обучения, запустив эти циклы обучения параллельно», — заявил Джемин Джордж.
В лаборатории отмечают, что рассчитывают при помощи нового алгоритма управлять скоплениями от десятков до сотен машин. Однако пока что команда испытала свой метод только на четырёх квадрокоптерах в пределах одного помещения, и применять алгоритм в условиях реального боя ещё рано.
«Прежде чем алгоритм можно будет применить в реальных условиях, необходимы обширные испытания в смоделированной и в настоящей среде с использованием физических ресурсов», - заключил Джемин Джордж.
Новый метод подробно описан в статье на arXiv.
tvr
«Как указывает издание The Register, скопление о
бученных беспилотных аппаратовюнитов можно будет отправлять в определенные области, снабдив их набором инструкций. При этом«стая» дроновподразделение юнитов будет автоматически поддерживать «строй» и выполнять приказы.»Что-то мне это напоминает.