В этой статье я постараюсь затронуть несколько тем:
- Выскажу свое мнение о помешательстве детей на кубической игрушке
- Расскажу об основной идее Malmo
- Покажу несколько примеров с кодом и дам понимание, куда можно идти дальше
- Расскажу об идее и результатах Malmo Challenge
Minecraft: моя предыстория
Я познакомилась с игрушкой, будучи уже студенткой. Это не помешало мне в тот же день отложить все свои личные, рабочие и академические цели, и целиком уйти в кубическую вселенную. Отпустило меня тогда только через месяц, но до сих пор я с радостью захожу иногда побегать часок по любимому миру.
Для меня Minecraft стал продолжением любимой игрушки детства – Lego, исправив ее главный недостаток: постоянную нехватку деталей. Аналог Lego с безлимитными деталями, что может быть лучше.
Хочется особо отметить отсутствие жестокости в этой игре. Вы можете убить зомби или разбежавшись, прыгнуть со скалы. Никто не спорит. Но отсутствие крови очень радует, так же как и милая визуализация зарождения новой жизни.
У Minecraft очень размытое понятие финальной цели. Конечно, вы можете прокачаться и убить дракона, с гордостью сказав, что вы прошли игру. Но так никто не делает. Основной кайф мира Minecraft в том, что каждый раз в нем можно придумать свою личную цель: исследовать мир и найти пещеру с тайниками, построить дом своей мечты, изучить основы электричества или зайти на сервер вместе с другом и делать друг другу всевозможные ловушки. Отсутствие цели в игре – на мой взгляд, главное ее преимущество. Minecraft дает огромный простор для творчества, при этом почти не ставит ограничений.
Изучая сабж, я случайно узнала, что мир Minecraft не ограничивается игрой, мерчем, летсплеями и фан артами. В игре снимают целые сериалы, и – неожиданно – они являются довольно популярными. На мой взгляд, это забавно.
Меня очень обрадовала новость о наличии open source фреймворка для программирования в мире Minecraft. Я твердо уверена, что в будущем в подавляющем числе профессий могут понадобиться базовые навыки программирования. Фреймворк на базе любимой игрушки, на мой взгляд, отличный способ показать ребенку захватывающий мир программирования.
Malmo: основная идея
Фреймворк Malmo был создан совместными усилиями нескольких исследователей, главной целью которых было адаптировать интересный мир к экспериментам в области искусственного интеллекта. Алгоритмов ИИ по-прежнему относительно мало, и все они имеют огромный потенциал для более детального изучения и усовершенствования. Мне очень нравится, что Microsoft создает дополнительную мотивацию к изучению неизведанного.
Технические моменты
Установка
Несмотря на четкое следование инструкции, вы можете столкнуться с целым рядом проблем в процессе установки. Мои проблемы в основном были связаны с тем, что некоторые компоненты у меня уже были поставлены, но версия отличалась. Все проблемы лечатся с помощью всем известного сайта.
Поддержка ОС и языков программирования
Несмотря на смелое заявление о поддержке всех трех популярных ОС, мне показалось, что тестирование было как следует проведено лишь для ОС Windows. Победив проблемы с установкой, ваша головная боль на ОС Windows обещает закончиться. На Linux проблемы, скорее всего, продолжатся, так как поднятый сервер периодически падает, не сообщая причин. Если вы продолжите мои эксперименты – обязательно пишите в комментарях о вашем опыте.
Авторы постарались поддержать большое число популярных языков и сделали обвязки для C#, C++, Lua, Python2 и Java. Я выбрала Python.
Как играть программировать в Malmo
Основной процесс выглядит следующим образом: в одном окошке вам необходимо поднять сервер и клиента. Для этого есть скрипт
./Minecraft/launchClient.*
. После того, как сервер поднялся, в другом окне вы можете запустить код с основной логикой для управления персонажем. Как узнать, что сервер поднялся? Все крайне логично: вы увидите запущенный экземпляр Minecraft с начальным меню внутри, а в терминале будет гордо красоваться надпись Building 95%
.Вы можете запустить сколько угодно экземпляров
launchClient
. В таком случае первый запущенный экземпляр будет являться сервером, а также клиентом, представляющим из себя одного персонажа. Все последующие экземпляры будут подключаться к уже поднятому серверу, добавляя дополнительного персонажа в мир. Логику для каждого из человечков вы можете реализовать в коде, а также можно управлять персонажем самостоятельно всем знакомыми клавишами AWSD.
Кроме сервака с клиентом и файла с логикой, мы также имеем xml файл с описанием начального состояния мира. Авторы не настаивают на его существовании, и в своих примерах они часто кладут его в строку и хранят в коде, но, на мой взгляд, удобнее сразу сделать его отдельным файлом, добавляя нужные куски по мере необходимости.
Авторы позаботились о нас и сделали внушительное число примеров, добавив к ним описание.
Мой совет: не пытайтесь начинать с нуля, возьмите за базу первый пример. В нем ничего не происходит, мы просто создаем самый простой плоский мир и присоединяемся к персонажу. В цикле while в конце вы можете по своему усмотрению добавить экшена в происходящее. Например, напишите там:
agent_host.sendCommand("move 1")
И насладитесь первыми шагами своего героя. Учтите, что по умолчанию используется т.н. ContinuousMovementCommands. Воспринимайте отдаваемые персонажу команды как изменение положения рычага. Говоря
"move 1"
, вы сделаете не один шаг. Вы будете бежать, пока не дадите команду "move 0"
. Такой код на практике не сдвинет человечка с места:agent_host.sendCommand("move 1")
agent_host.sendCommand("move 0")
Команды выполнятся за считанные доли секунды. Не забывайте вставлять периодические строчки
"time.sleep(X)"
. Я уверена, что вы знаете, где брать информацию об остальных командах (хотя, по моему опыту, проще по диагонали просмотреть туториал и затем искать нужное в исходниках).В xml файле вы можете задать режим игры:
<AgentSection mode="Survival">
<!-- замените на Creative и летайте по миру -->
Задайте начальное время, позицию персонажа, кастомизируйте мир: сделайте его плоским или приближенным к реальности.
Вот этот код нарисует вам Пакмана, который поедает шарики и уходит в радужный кратер:
<FlatWorldGenerator generatorString="3;7,44*49,73,35:1,159:4,95:13,35:13,159:11,95:10,159:14,159:6,35:6,95:6;12;lake,lava_lake" />
<DrawingDecorator>
<DrawSphere x="-60" y="70" z="0" radius="30" type="air"/>
<DrawSphere x="-60" y="80" z="30" radius="10" type="wool" colour="YELLOW"/>
<DrawCuboid x1="-50" y1="80" z1="30" x2="-70" y2="70" z2="20" type="air"/>
<DrawSphere x="-60" y="75" z="25" radius="2" type="wool" colour="WHITE"/>
<DrawSphere x="-60" y="68" z="18" radius="2" type="wool" colour="MAGENTA"/>
<DrawSphere x="-60" y="61" z="11" radius="2" type="wool" colour="PURPLE"/>
<DrawSphere x="-60" y="54" z="4" radius="2" type="wool" colour="PINK"/>
</DrawingDecorator>
Наконец, в xml можно добавить необходимые координаты для добавления обзора персонажу:
<ObservationFromGrid>
<Grid name="floor3x3">
<min x="-1" y="0" z="-1" />
<max x="1" y="0" z="1" />
</Grid>
</ObservationFromGrid>
По умолчанию у нас нет возможности осмотреться и получить информацию о ближайших блоках. Тем не менее, мы можем сказать, что хотим знать, что находится вокруг нас. Учтите, что в этом случае нам нужно использовать относительные координаты, отсчитываемые от кубика с ногами героя. В результате выполнения подобной строчки:
grid = observations.get(u'floor3x3', 0)
Мы получим массив со строками. Каждая строка – это текстовое представление типа одного из кубиков.
floor3x3: ['lava', 'obsidian', 'obsidian', 'lava', 'obsidian', 'obsidian', 'lava', 'obsidian', 'obsidian']
Таким образом можно создать ИИ, который исследует мир, ищет что-либо и не умирает по глупым причинам. Простейший вариант без использования машинного обучения я реализовала тут.
Фичи для ИИ
Конечно же, первое, что мне захотелось увидеть для реализации алгоритмов ИИ в malmo – это возможность двигаться дискретно. В вопросе ИИ и так хватает сложностей, и не хочется добавлять ко всему прочему постоянную корректировку направления и скорости движения.
Включаем нужное в xml так:
<DiscreteMovenetCommands/>
К сожалению, этого будет недостаточно. Чтобы двигаться дискретно, ваше начальное положение должно быть строго в центре кубика:
<Placement x="4.5" y="46.0" z="1.5" yaw="0"/>
<!-- y - высота, x, z - плоскость движения -->
Целые координаты поставят вас в пересечение кубов, персонаж откажется двигаться с места, никаких предупреждений и ошибок вы не увидите. В туториале об этом также не предупреждают. Я потратила около 4 часов, чтобы осознать суть проблемы и сделать координаты x и z половинчатыми. (y отвечает за высоту и не играет роли в данной истории).
Кроме этого, исследователи добавили несколько приятных фич для решения задачи обучения с подкреплением (Reinforcement Learning). Алгоритмы этого типа подразумевают постоянное награждение или наказание искусственного интеллекта за те или иные действия. Разработчики продумали этот момент и добавили возможность прописать эти действия/события в xml, избавив код от постоянных одинаковых проверок. Вы также можете задать окончание игры по наступлению некоторого события:
<RewardForTouchingBlockType>
<Block reward="-100.0" type="lava" behaviour="onceOnly"/>
<Block reward="100.0" type="lapis_block" behaviour="onceOnly"/>
</RewardForTouchingBlockType>
<RewardForSendingCommand reward="-1" />
<AgentQuitFromTouchingBlockType>
<Block type="lava" />
<Block type="lapis_block" />
</AgentQuitFromTouchingBlockType>
Например, тут мы постоянно чуть-чуть наказываем персонажа за каждый шаг, не увенчавшийся победой; сильно награждаем за победу и наказываем за смерть; наконец, завершаем раунд в случае смерти или выигрыша.
Malmo: вывод
Авторы фреймворка подарили нам потрясающую возможность погрузиться в любимый мир с другой стороны. Malmo пока что находится в бете, во многих ситуациях он… заставляет совершенствовать свои навыки в troubleshooting. Тем не менее, его плюсы перевешивают все его минусы, а тот факт того, что исходники лежат в открытом доступе на github, позволяет нам самостоятельно доделать нужное место или создать issue для исправления критических багов.
Авторы проекта по понятным для меня причинам не упоминают ни в одной из статей возможность обучать детей на основе фреймворка: ребенок вряд ли справится с борьбой с мелкими, но частыми багами. Тем не менее, я уверена, что если родитель поможет своему ребенку и будет программировать вместе с ним, это даст отличные результаты и позволит вам провести время с пользой.
Malmo Challenge: история и результаты
Кроме самого фреймворка, Microsoft также проводил соревнование на базе платформы, названной Malmo Challenge. Оно было призвано побудить ученых и исследователей к работе над коллаборативными алгоритмами. Конкурс стартовал примерно полгода назад, а результаты появились 5 июня.
Суть челленджа в следующем: у нас есть плоский мир, забор сложной формы, внутри загона бегает хрюшка и ходит 2 человека. Наша задача – создать ИИ для одного из персонажей, которых сможет взаимодействовать со вторым, чтобы вместе они загнали хрюшку в замкнутое пространство. Второй персонаж может вести себя рандомно, может управляться человеком, другим ИИ, это может быть даже второй экземпляр вашего собственного ИИ.
При этом, вы можете получить максимальное число очков, поймав хрюшку, или же получить небольшое число очков, прыгнув в лужу сбоку. Вы не получите ничего, если ваш напарник решит прыгнуть в лужу, отказавшись от взаимодействия с вами.
Эта задача в общем виде называется Охота на оленя. Она была сформулирована еще в 18 веке Жан Жаком Руссо. Несмотря на внушительный возраст проблемы, до сих пор неясно, какой алгоритм наиболее эффективно решает поставленную задачу.
Я рада поделиться с вами результатами соревнования. Меня очень удивило распределение мест в турнирной таблице.
Первое место занял проект команды из Великобритании. Авторы трезво оценили сильный недостаток времени, поняли, что они вряд ли успеют адаптировать для задачи сложные существующие алгоритмы. Они выбрали Байесовский вывод для определения типа напарника, а также Марковские цепи для непосредственного игрового процесса. И победили.
Участники, занявшие второе место, решили взять самые сложные из существующих решений, они использовали DNN, Reinforcement learning, DQN, A3C model… И это все не помогло им обойти Байеса и Марковские цепи.
Подытожим статью мыслью о том, что нужно быть проще.
Если вам хочется также попробовать создать свой ИИ, присоединяйтесь к нашему русскоязычному чату про нейронные сети в Telegram. Там вы можете задать интересующие вас вопросы, а также поделиться вашими достижениями.
Видео с моим рассказом о Malmo на встрече Петербургского Python митапа уже появилось на моем канале на Youtube. Там также есть записи других моих лекций и прочая болтовня про IT.
Комментарии (15)
fireSparrow
19.06.2017 13:25+1Насколько подходит Malmo для того, чтобы просто автоматизировать какие-то действия в обычной игре?
Например, чтобы сделать бота, который просто рубит дрова, работает на ферме?
А то в креативном режиме не вижу интереса играть, а в нормальном — раздражает некоторая рутина, которую так и тянет автоматизировать.telezhnaya
19.06.2017 13:43Не подходит. У Malmo своя урезанная open source версия игры, к настоящему Minecraft будет не присоединить сделанного бота.
Вместо бота для фарма в реальной игре можно использовать чит коды и брать нужное количество дерева или пшеницы. На выходе один и тот же результат.
Меня интересовало грандиозное строительство, но было лень строить монотонную огромную стену, а она, допустим, является важной частью постройки. Можно сделать бота в Malmo и закодить замок своей мечты :)
Но, опять, я не нашла способов перенести его на реальный игровой сервер с помощью Malmo.fireSparrow
19.06.2017 14:20Жаль.
С читами мне не интересно, а вот накодить команду рабов и заниматься организацией их работы — это гораздо веселее :)
Но единственный более-менее рабочий инструмент для этого, из того, что я видел — это Mineflayer. Там вроде бы крутые возможности, но кодить нужно на JS, который я не очень люблю.Stalker_RED
20.06.2017 08:39С модами можно автоматизировать очень много всего. Мультифермы из forestry позволят вам практически забыть о ручной добыче еды и древесины, например.
bano-notit
19.06.2017 14:20+4Знаете. Вот давно уже знаю этот мод, и думал, что многие игроки про него знают. А оказывается нет. Этот мод — ComputerCraft, в нём есть боты, которых нужно кодить, но есть ещё мод, который более прокачен и более современный и на вид и на функциональность. Это — OpenComputers. В обоих нужно программировать на Lua. Их вполне можно использовать в одиночке, но для того, чтобы автоматизировать вам всё же придётся постараться, сначала с крафтом, достаточно дорогим, и потом ещё с программированием, чтобы ваши боты не купались в лаве и не застревали в гравиевых "оползнях". Это отделяет их от "читерства".
Как ни странно, но на этих компах и роботах тоже можно сделать искуственный интеллект. Но мне они были чисто в качестве простой реализации своего протокола передачи данных и организации свой инфраструктуры с серверами, домашними пк и тд...worldand
20.06.2017 07:46Согласен со всем комментом.
Я не смотрел Open Computers, но с CC имел дело. И это достаточно интересная модификация.
Наверное, мод непопулярен исключительно из-за необходимости наличия алгоритмичесого мышления. А оно есть не у всех.
bro-dev
20.06.2017 07:46На внешнем сервере очень вероятно что никакой свой код не дадут исполнить, то есть нельзя ставить моды даже клиентские. Единственный способ это писать бота на любом языке анализируя картинку с экрана.
Zashikivarashi
20.06.2017 07:46Возьмите технический модпак, там и кодить обычно можно и простор для автоматизации, хоть совсем автоматически хоть големами.
jabr
19.06.2017 15:26+1Программирование в minecraft на питоне 2.7
только она про движок bukkit который вроде то ли закрыт, то ли пытались закрыть…
для forge есть плагин https://github.com/martinohanlon/mcpi
Кажется макс. версия, в которой все работало — 1.7.10
Simplifier
20.06.2017 07:47Что-то из поста непонятно, какие же фичи для ИИ там есть. В посте только реворды указаны. Или по сути Malmo только API для Майнкрафта предлагает? Как альтернативу этому API?
telezhnaya
20.06.2017 07:53Мне кажется, вы не до конца понимаете преследуемые цели двух фреймворков.
Malmo создавался с целью привлечь исследователей к решению задач искусственного интеллекта. Реализовывать внутри Malmo алгоритмы ИИ было бы глупой затеей — всё равно люди пользовались бы уже знакомыми им библиотеками, которые никто не запрещает подключать.
Ценность malmo не в количестве фич, а в аудитории, которую авторы собрали вокруг него. Мне было интересно посмотреть, кто сделал fork и что там происходит. Большое количество молодых ученых работают с malmo и тренирут внутри свой ИИ.
Если вы знаете, что явно стоит добавить в Malmo для облегчения работы с ИИ — обязательно заведите issue, а заодно поделитесь с нами вашими идеями :) Мне будет очень интересно.
izzholtik
Программирование на XML?..
telezhnaya
Python + xml конфиг
На Python очевидный код, поэтому я ограничилась небольшими вставками и ссылками. Конфиг дался мне чуть сложнее, поэтому xml вставок больше.