DeepMind представила бота MuZero, который играет в старые игры и в шахматы / forpes.ru

Главная
DeepMind представила бота MuZero, который играет в старые игры и в шахматы

DeepMind представила бота MuZero, который играет в старые игры и в шахматы +6

24.12.2020 06:38

maybe_elf 4 1800 Источник

DeepMind AI представила агента искусственного интеллекта MuZero. Его обучили играть в десятки старых видеоигр Atari, шахматы и ??настольные игры типа Go. В отличие от предшественников, бот самостоятельно вырабатывает для себя правила игры.

Сейчас MuZero подключили к разработке алгоритма кодирования видео, который может сократить расходы YouTube.

MuZero работает на системе ИИ глубокого обучения с подкреплением — техники, в которой многоуровневые нейросети позволяют машинам обучаться новым навыкам методом проб и ошибок, получая «вознаграждение» за успех.

При разработке MuZero использовали программу DQN, которая достигла высокого уровня мастерства в видеоиграх Atari. Также были задействованы:

AlphaGo, программа, которая победила чемпиона Go Ли-Седола со счетом 4:1 в соревновании 2016 года;
AlphaGo Zero, которая превзошла AlphaGo по производительности в 2017 году после обучения с нуля и была ознакомлена только с основными правилами игры;
AlphaZero, которую можно применять не только в Go, но и в шахматах и сёги.

Сообщается, что MuZero оказался немного лучше AlphaZero в игре Go, несмотря на то, что за каждый ход выполнялось меньше вычислений. Бот также превзошел R2D2 — ведущий игровой алгоритм Atari — в 42 из 57 игр, протестированных на старой консоли. Более того, он сделал это после того, как выполнил только половину тренировочных шагов.

Оба достижения указывают на то, что MuZero способен более эффективно извлекать больше информации из меньшего количества данных.

Венди Холл, профессор компьютерных наук в Университете Саутгемптона и член правительственный совет по ИИ, отметил, что новая система со временем сможет добиться «сверхчеловеческой производительности», а данная работа является «значительным шагом вперед», но при этом вызывает обеспокоенность. Он обратил внимание на то, какие последствия может иметь разработка такого бота.

В DeepMind задумались о практическом применении MuZero. Сейчас бота задействовали в изобретении нового вида сжатия видео.

Более подробная информация о способах применения MuZero появится в 2021 году. Потенциально бота можно использовать для разработки виртуальных помощников нового поколения, медицинских и поисково-спасательных технологий.

Ранее DeepMind продемонстрировала последнюю версию системы ИИ AlphaFold, которая способна давать надежные прогнозы базовой физической структуры белка за считанные дни. Прорыв в фолдинге белка признали организаторы критической оценки прогнозирования структуры белка (CASP).

См. также:

«Google списала $1,5 млрд долгов своему подразделению DeepMind»

«О шахматах. И не только»

«10 ключевых технологий последнего десятилетия»

Комментарии (4)

pdima
24.12.2020 10:02
#22458196
Его же уже больше года как представили: Mastering Atari, Go, Chess and Shogi by Planning with a Learned Model
1. Stecenko
  24.12.2020 12:37
  #22458862
  В оригинале заметки:
  
  Now, in a paper in the journal Nature, we describe MuZero, a significant step forward in the pursuit of general-purpose algorithms.
  …
  MuZero, first introduced in a preliminary paper in 2019,…
  
  Т.е. в 2019 была предварительная статья, а вчера — окончательный вариант статьи.

KvanTTT
24.12.2020 13:09
#22459032
Интересно, выкатят ли DeepMind бота AlphaStar, который обучался только на играх с самих собой? Что-то с момента анонса о нем особых новостей нет, игроков результат не особо удовлетворил. Или MuZero обучить играть в Starcraft.

Lisptracker
24.12.2020 16:27
#22460098
Интересно, почему он якобы лучше в го и шахматах, судя по описанию, алгоритм подкрепления по сути тот же самый, как он может извлечь больше информации, если её там физически нет ???

DeepMind представила бота MuZero, который играет в старые игры и в шахматы +6

Комментарии (4)

pdima

Stecenko

KvanTTT

Lisptracker