На днях представители подразделения DeepMind (сейчас входит в состав холдинга Alphabet) сообщили о предоставлении бесплатного доступа разработчикам к исходному коду платформы DeepMind Lab. Это сервис машинного обучения на базе Quake III, который предназначен для обучения искусственного интеллекта. А именно — научиться решать задачи в трехмерном пространстве без вмешательства человека. Основой платформы является движок игры Quake III Arena.

Внутри игрового мира ИИ получает форму сферы и возможность летать, изучая окружающее пространство. Цель, которую ставят перед собой разработчики — научить слабую форму ИИ «понимать», что происходит и реагировать на различные ситуации, происходящие в виртуальном мире. «Персонаж» может выполнять ряд действий, перемещаться по лабиринту, изучать ближайшее окружение.

«Мы стараемся разрабатывать различные формы ИИ, способные выполнять ряд задач от обычного изучения игрового мира до совершения каких-либо действий с анализом их последствий», — рассказывает Шейн Легг, главный научный сотрудник DeepMind.



Специалисты надеются, что ИИ сможет учиться методом проб и ошибок. Игры в этом случае — почти идеальный вариант. Например, ранее в DeepMind использовали (и используют сейчас) игровую консоль Atari для того, чтобы научить нейросеть выполнять последовательные действия, необходимые для игры.

Но открытый трехмерный мир, который можно изменять, представляет гораздо более перспективную среду для обучения ИИ, чем плоский мир графически простых игрушек для Atari. ИИ в трехмерном мире имеет четкие задания, которые последовательно меняются таким образом, что опыт, полученный при решении каждого предыдущего задания, оказывается полезным для ИИ в ходе решения последующего.

Плюсом трехмерного окружения является то, что с его помощью можно обучать компьютерные системы реагировать на различные проблемы, которые могут ожидать робота и в реальном мире. При помощи такого симулятора без проблем обучаются промышленные роботы. А работать с виртуальным окружением не в пример проще в некоторых случаях, чем обучать такие системы «вручную».

При этом большинство современных нейросетей разрабатывается для решения одной специфической задачи (обработка изображений, например). Разработчики новой платформы обещают, что она поможет создать универсальную форму ИИ, способную решать большое количество задач. Причем помощь людей в этом случае компьютерной системе не понадобится. Генерация окружения для нейросети происходит каждый раз в случайном порядке.


По мнению разработчиков платформы, она помогает учиться ИИ примерно так же, как обучаются дети. «Как вы или я изучали мир в детстве», — привел пример один из сотрудников DeepMind. «Сообщество специалистов по машинному обучению было всегда очень открытым. Мы публикуем около 100 статей в год, кроме того, мы открыли исходный код многих своих проектов».

Сейчас Google DeepMind открыло исходный код DeepMind Lab, выложил его на GitHub. Благодаря этому любой человек может скачать код платформы и модифицировать ее под свои нужны. Представители проекта заявляют, что новые игровые уровни подключившиеся специалисты могут создавать самостоятельно, загружая собственные проекты на GitHub. Это может помочь всему сообществу работать над достижением своей цели быстрее и эффективнее.

Этот проект — не единственный для DeepMind. В прошлом месяце его представители заключили договор о сотрудничестве с Activision Blizzard Inc. Цель — превращение среды Starcraft 2 в тестовую площадку для искусственного интеллекта. Возможно, в скором времени к этому проекту подключатся и другие разработчики игр. К слову, ИИ в игровой среде не получает над противником никакого преимущества, используя для продвижения лишь визуальную информацию, как и человек.

На практике это означает, что ИИ Google понадобится предугадывать, что в каждый конкретный момент времени делает противник, чтобы адекватно отвечать на действия «врага». Кроме того, необходимо будет быстро реагировать на то, что пошло вне плана. Все это позволит протестировать уже следующий уровень возможностей искусственного интеллекта. «В конце-концов мы хотим применить эти способности для решения общемировых проблем», — сообщил Демис Хассабис (Demis Hassabis), основатель компании Deepmind (именно ее в 2014 году купил Google, и сейчас на базе достижений купленной компании ведется разработка ИИ).

Специалисты, связанные с ИИ, высказывают осторожное одобрение проекту. «Очень хорошо то, что они дают большое количество типов окружения», — заявил сооснователь OpenAI Илья Сутскевар (Ilya Sutskevar). «Чем с большим количеством типов окружения столкнется система, тем быстрее она будет развиваться», — продолжил он. И действительно, трехмерная среда обучения ИИ содержит более 1000 уровней и типов окружения.

Зубин Гахрахмани (Zoubin Gahrahmani), профессор из Кэмбриджа, считает, что DeepMind Lab и другие платформы для усиления развития искусственного интеллекта способствуют прогрессу, допуская исследователей к разработанной среде. При этом проекты, подобные этому, достаточно прозрачны. Он также заметил, что у человека достижение определенного уровня игры занимает гораздо меньше времени, чем у компьютера. Поэтому профессор высказывает сомнение в том, что ИИ, слабую его форму, будет сложно хотя бы приблизить до уровня человека в плане скорости обучения.
Поделиться с друзьями
-->

Комментарии (12)


  1. QDeathNick
    06.12.2016 02:07

    Как быстро ИИ сам научится считать время мегахелсы и красного броника :)

    Мой любимый движок. Сколько времени было потрачено из-за режима матрицы /timescale 0.1, хорошо, что только в сингле была плавность при этом, иначе было бы потрачено гораздо больше.


    1. DrZlodberg
      06.12.2016 08:43

      А смысл 0.1? Так, ради интереса разве.
      2.0 гораздо практичнее ;) Хотя после 1.7 комп уже с трудом вытягивал и честных 2 скорее всего уже не тянул.
      Считать научится, думаю, не сильно медленнее чем обычный новичок. Как только поймёт их пользу будет просто тусить около них и привыкнет ко времени респауна.


      1. QDeathNick
        06.12.2016 15:32

        Ставишь против себя кучу найтмарных ботов и как Нео одними кулаками их валишь в замедленном режиме. Хотя из оружия тоже круто в этом режиме стрелять, можно успевать медленной ракетой рассчитывать упреждения и снимать врагов в воздухе, что обычно редко удается.
        Так же удобно тренировать всякие джампы (рокетджамп, плазмаджам и.т.д.)
        Потом постепенно ускоряешь(помню даже кнопки под это биндил), и таким образом как бы разгоняешь свою реакцию.
        Ну и вообще, сейчас такие игры появились в большом количестве, а тогда только в МаксПейне был эффект замедления времени.


        1. DrZlodberg
          06.12.2016 15:59

          Ну не знаю. Я наоборот, с ботами на 2.0 гонял. Обычная скорость после этого такая медленная и плавная. Выпустил ракету, попил чаю и она только долетела :)
          Как можно разогнать реакцию замедлив скорость? Как раз наоборот, врубаешь максимум и через некоторое время начинаешь в этом адском мельтешении ориентироваться. Плюс прокачивается управление. Т.к. на такой скорости сначала банально перестаёшь попадать в повороты. А на открытых картах типа дм17 валишься в минуса просто самостоятельно падая вниз.
          Упреждение, кстати, хорошо тренировать на картах с длинными прыжками, типа дм17. Когда скорость большая, но летит долго и по предсказуемой траектории. Снизу прыгунов на нычку с квадом ракетами снимать милое дело.

          На самом деле с замедлением по приколу мы тоже игрались, но ещё в q1. Правда тогда смысла в этом не нашли.


  1. Arxitektor
    06.12.2016 09:11

    около них и привыкнет ко времени респауна.
    А что за игра на видео?


    1. QDeathNick
      06.12.2016 11:40

      Видимо не игра, просто уровень для обучения ИИ.


    1. QDeathNick
      06.12.2016 15:44
      -1

      Хитрость в том, что он должен бегать от одного к другому, а не стоять около них.
      А для этого надо не просто смотреть на экран и выбирать куда бежать, а научится помнить где и что лежит и считать когда появится и рассчитывать путь с учетом времени.
      Если ИИ научится это делать, просто глядя на экран, то я боюсь представить, что он сможет сразу научится делать, глядя например на котировки и вообще в браузер.


    1. 2morrowMan
      07.12.2016 12:16

      Quake III Arena с кастомным уровнем с простенькой графикой и HUD.


  1. General_Failure
    06.12.2016 12:02

    Гифка напомнила заставку Лабиринт из 95-й (или 98-й, не помню уже) винды
    Мелкософт уже тогда ИИ занимался?


  1. 2morrowMan
    07.12.2016 12:22
    +1

    «В конце-концов мы хотим применить эти способности для решения общемировых проблем», — сообщил Демис Хассабис (Demis Hassabis), основатель компании Deepmind

    … поэтому мы будем тренировать ИИ на шутере и военной стратегии…


    1. herr_kaizer
      10.12.2016 11:31

      Это геймификация. Среднему программисту вряд ли будет интересно контрибутить в проект, в котором результатом работы будут циферки и таблицы.


  1. Vinchi
    07.12.2016 15:42

    надо ему предложить проходить portal и talos principle. Вот там реально сложные задачки на логику, да и сообщество сделало очень много кастомных уровней.