В 2017 году покерный бот Libratus попал в заголовки СМИ, когда обыграл четырёх профессионалов в безлимитный холдем на дистанции 120 000 рук. Теперь технологию адаптировали для военного применения.
Разработчики систем слабого ИИ часто сравнивают эффективность своих программ в игровом противостоянии против человека. В играх с полной информацией в любой момент игры все игроки имеют полную информацию о состоянии игры, то есть о позиции и всех возможных ходах любого из игроков. В отличие от таких детерминированных ситуаций, в играх с неполной информацией часть информации о состоянии игры скрыта от игрока — например, карты оппонента. Безлимитный холдем как раз одна из таких игр. Кроме закрытых карт оппонента, добавляется здесь элемент неопределённости за счёт произвольного размера каждой ставки. С учётом этого количество возможных исходов оценивается в 10161. Выработка оптимальной стратегии в условиях неопределённости с учётом тактики оппонента — именно то, что нужно военным.
Libratus («сбалансированный» с латинского языка) создан исследователями из Университета Карнеги-Меллона для тестирования идей автоматизированного принятия решений на основе теории игр. В начале прошлого года, после громкой победы над профессионалами, ведущий автор программы, профессор Туомас Сандхолм, основал стартап под названием Strategy Robot, чтобы адаптировать игровую технологию для использования правительством. Например, в военных играх и симуляциях для изучения военной стратегии и планирования. В конце августа, согласно публичным записям, компания заключила двухлетний контракт с армией США на сумму до $10 млн. Финансирование выделено Отделением оборонных инноваций (Defense Innovation Unit), которое Пентагон образовал в 2015 году для улучшения контактов с компаниями Кремниевой долины и более активного внедрения новых технологий.
Стратегия Libratus на различных этапах раздачи. По итогам раздачи модель игры против конкретного оппонента уточняется
Libratus построен на алгоритмической (вычислительной) теории игр. В хэдзапах с профессионалами бот выиграл более 1,8 миллиона условных долларов: на протяжении турнира он разработал мощные стратегии ставок и даже продемонстрировал возможность блефа.
Сандхолм уверен, что этот подход применим ко многим другим играм, а также военным симуляторам. Сейчас военные игровые упражнения обычно проверяют только небольшое количество стратегий для воображаемых противников: «Это открывает перед вами много возможностей для эксплуатации, потому что настоящий противник может играть не в соответствии с вашими предположениями», — говорит профессор.
Сандхолм отказывается обсуждать специфику проектов Strategy Robot, хотя фирма заключила ещё как минимум один государственный контракт. Он говорит, что программа помогает в имитационных задачах, которые включают в себя принятие решений в моделируемом физическом пространстве, например, где разместить воинские части.
Покерная техника Libratus позволяет предположить, что стратегический бот может дать военным некоторые удивительные рекомендации. Профессиональные игроки, которые противостояли боту, по ходу турнира с удивлением обнаружили, что он неожиданно переключается с тайтовой на гиперагрессивной тактику, так что его действия практически невозможно предсказать — но все действия бота строго нацелены на победу. «Это странно, потому что нет впечатления, что он играет лучше вас, но затем вы смотрите на счёт и понимаете, что произошло», — говорит Сандхолм.
По мнению специалистов, подобные технологии могут сделать военные игры и симуляции более полезными, хотя результаты всё равно останутся лишь одним из компонентов стратегического планирования. Реальный мир намного сложнее и запутаннее, чем сценарии, которые способны освоить даже лучшие технологии ИИ.
Стратегический бот Libratus — не единственная попытка Пентагона применить современную теорию игр и слабый ИИ в военном деле. Исследовательское агентство DARPA запустило специальную программу «Последовательное взаимодействие в играх с неполной информацией применительно к принятию сложных военных решений (SI3-CMD)». Майкл Уэллман, профессор Мичиганского университета, говорит, что пример Libratus показывает: технология почти созрела для реального применения: «Прорыв в покере был просто поразительным, и с другими играми дела идут быстро. Пришло время попробовать это в более реальных областях», — сказал он.
Кроме Strategy Robot, профессор Сандхолм основал ещё один стартап Strategic Machine, где адаптирует стратегического бота для коммерческих задач, таких как рынки электроэнергии, спорт и компьютерные игры.
Технологии ИИ интересуют военных не только США, но также России и Китае, пишет Wired. Профессор Сандхолм не разделяет опасения по этому поводу. Он считает, что ИИ «сделает мир намного безопаснее».
Разработчики систем слабого ИИ часто сравнивают эффективность своих программ в игровом противостоянии против человека. В играх с полной информацией в любой момент игры все игроки имеют полную информацию о состоянии игры, то есть о позиции и всех возможных ходах любого из игроков. В отличие от таких детерминированных ситуаций, в играх с неполной информацией часть информации о состоянии игры скрыта от игрока — например, карты оппонента. Безлимитный холдем как раз одна из таких игр. Кроме закрытых карт оппонента, добавляется здесь элемент неопределённости за счёт произвольного размера каждой ставки. С учётом этого количество возможных исходов оценивается в 10161. Выработка оптимальной стратегии в условиях неопределённости с учётом тактики оппонента — именно то, что нужно военным.
Libratus («сбалансированный» с латинского языка) создан исследователями из Университета Карнеги-Меллона для тестирования идей автоматизированного принятия решений на основе теории игр. В начале прошлого года, после громкой победы над профессионалами, ведущий автор программы, профессор Туомас Сандхолм, основал стартап под названием Strategy Robot, чтобы адаптировать игровую технологию для использования правительством. Например, в военных играх и симуляциях для изучения военной стратегии и планирования. В конце августа, согласно публичным записям, компания заключила двухлетний контракт с армией США на сумму до $10 млн. Финансирование выделено Отделением оборонных инноваций (Defense Innovation Unit), которое Пентагон образовал в 2015 году для улучшения контактов с компаниями Кремниевой долины и более активного внедрения новых технологий.
Стратегия Libratus на различных этапах раздачи. По итогам раздачи модель игры против конкретного оппонента уточняется
Libratus построен на алгоритмической (вычислительной) теории игр. В хэдзапах с профессионалами бот выиграл более 1,8 миллиона условных долларов: на протяжении турнира он разработал мощные стратегии ставок и даже продемонстрировал возможность блефа.
Сандхолм уверен, что этот подход применим ко многим другим играм, а также военным симуляторам. Сейчас военные игровые упражнения обычно проверяют только небольшое количество стратегий для воображаемых противников: «Это открывает перед вами много возможностей для эксплуатации, потому что настоящий противник может играть не в соответствии с вашими предположениями», — говорит профессор.
Сандхолм отказывается обсуждать специфику проектов Strategy Robot, хотя фирма заключила ещё как минимум один государственный контракт. Он говорит, что программа помогает в имитационных задачах, которые включают в себя принятие решений в моделируемом физическом пространстве, например, где разместить воинские части.
Покерная техника Libratus позволяет предположить, что стратегический бот может дать военным некоторые удивительные рекомендации. Профессиональные игроки, которые противостояли боту, по ходу турнира с удивлением обнаружили, что он неожиданно переключается с тайтовой на гиперагрессивной тактику, так что его действия практически невозможно предсказать — но все действия бота строго нацелены на победу. «Это странно, потому что нет впечатления, что он играет лучше вас, но затем вы смотрите на счёт и понимаете, что произошло», — говорит Сандхолм.
По мнению специалистов, подобные технологии могут сделать военные игры и симуляции более полезными, хотя результаты всё равно останутся лишь одним из компонентов стратегического планирования. Реальный мир намного сложнее и запутаннее, чем сценарии, которые способны освоить даже лучшие технологии ИИ.
Стратегический бот Libratus — не единственная попытка Пентагона применить современную теорию игр и слабый ИИ в военном деле. Исследовательское агентство DARPA запустило специальную программу «Последовательное взаимодействие в играх с неполной информацией применительно к принятию сложных военных решений (SI3-CMD)». Майкл Уэллман, профессор Мичиганского университета, говорит, что пример Libratus показывает: технология почти созрела для реального применения: «Прорыв в покере был просто поразительным, и с другими играми дела идут быстро. Пришло время попробовать это в более реальных областях», — сказал он.
Кроме Strategy Robot, профессор Сандхолм основал ещё один стартап Strategic Machine, где адаптирует стратегического бота для коммерческих задач, таких как рынки электроэнергии, спорт и компьютерные игры.
Технологии ИИ интересуют военных не только США, но также России и Китае, пишет Wired. Профессор Сандхолм не разделяет опасения по этому поводу. Он считает, что ИИ «сделает мир намного безопаснее».
Комментарии (4)
old_bear
22.01.2019 05:35Профессор Сандхолм не разделяет опасения по этому поводу. Он считает, что ИИ «сделает мир намного безопаснее».
Ну да, Нобель тоже думал, что динамит фактом своего существования отобьёт у государств желание начинать войны.w3ga
22.01.2019 07:09Просто Петагону начали урезать финансирование, вот они и решили пополнить свой бюджет за счёт он-лайн покера))
tvr
Ну наконец-то, картишки с камуфлированной рубашкой и профурсетки в ОЗК.
Fallout'ом повеяло.