Пять профессиональных игроков в го не смогли ничего противопоставить натиску AlphaGo
Представители компании DeepMind на днях заявили о том, что игра с Кэ Цзе была последним сражением компьютерной системы AlphaGo с человеком. После победы во всех трех матчах подряд стало понятно, что с компьютером человеку уже не совладать, поэтому для системы играть с другими чемпионами в го просто нет смысла, исход будущих матчей можно считать предрешенным. По словам главы DeepMind Демиса Хассабиса, AlphaGo достигла уже всех возможных высот в го, поэтому время сменить профиль и попробовать себя в новой сфере.
Впервые весь мир услышал о компьютерном игроке в го чуть больше года назад, когда компьютер выиграл со счетом 4:1 у Ли Седоля, одного из чемпионов го. Никто не ожидал такого результата, поскольку эта игра считалась ранее сложной для компьютеров. Здесь огромное количество вариантов выбора хода, гораздо больше, чем в шахматах. По этой причине го считалась прерогативой человека. Но все меняется, компьютеры становятся совершеннее, так что современные программно-аппаратные платформы умеют то, чего не умели компьютеры всего пару-тройку лет назад.
Напомню, что два года назад AlphaGo обыграла чемпиона Европы, после чего, год спустя, выиграла уже у одного из чемпионов мира Ли Седоля. Правда, ему тоже удалось добиться победы в одном из пяти матчей. Сейчас, после проигрыша Кэ Цзе это дало повод говорить, что Ли Седоль — последний человек, которому удалось победить AlphaGo, пускай и единожды.
AlphaGo стала победителем во всех трех матчах с Кэ Цзе. В третьем матче китайский чемпион был вынужден сдаться, несмотря на то, что у него оставалось еще немногим более получаса на обдумывание ходов. Цзе играл белыми камнями, система — черными, так что первый ход сделала AlphaGo.
Не только Кэ Цзе не справился с мощью AlphaGo, не одолели систему и пять других мастеров, которые играли против компьютера впятером одновременно. Матч завершился полной победой ИИ-платформы от DeepMind. Еще система сражалась сама с собой, само собой, выиграла и проиграла одновременно.
Эксперты, следившие за ходом игры, утверждают, что профессионалы из мира го взяли на вооружение многие приемы, разработанные компьютером, которые и привели к победе системы.
«Команда AlphaGo теперь бросит все силы на преодоление новых высот, разрабатывая различные алгоритмы, которые однажды помогут ученым решить наиболее сложные проблемы, например, определить пути распространения заболеваний, снизить энергопотребление в глобальном масштабе или создать революционно новые материалы», — заявил глава DeepMind.
Также он сказал, что вся команда разработчиков всегда верила в то, что AlphaGo станет полезным для человечества. Например, эта система сможет помочь сделать какое-то открытие и извлечь из него пользу. А го — лишь пример того, на что способны современные технологии. Уже сейчас AlphaGo помог игрокам в го начать искать новые стратегические находки в игре, которые, в частности, использовал и Кэ Цзе. Определенно, это успех — ведь компьютер смог помочь найти новые интересные аспекты в игре, которой исполнилось уже 3000 лет.
Интересно, что AlphaGo не станет общедоступным сервисом (как, например, IBM Watson). Разработчики будут использовать систему пока в закрытом режиме, пытаясь найти полезные и нужные варианты ее использования. В скором будущем DeepMind опубликует документы о том, как эта система смогла достичь высот и какие технологии при этом использовались.
AlphaGo играла с людьми в рамках праздника го в китайском городе Вужень (провинция Чжэцзян). Первые две игры Кэ Цзе проиграл, так что уже после второго матча было понятно, что система выходит победителем, но оставалась еще и третья игра, участие в которой было делом чести для Цзэ.
Что касается стиля игры системы, то один из профессиональных игроков в го сказал, что считает игру AlphaGo «человеческой». «AlphaGo играет очень уверенно, и это придает уверенности мне. Это помогает мне верить, что я могу управлять ходом игры», — заявил Лянь Сяо.
Что будет делать AlphaGo дальше? Возможно, система начнет осваивать новые высоты в StarCraft II. Несколько месяцев назад создатели системы вместе с Blizzard объявили о намерении создать платформу для разработки ИИ-систем для игры в StarCraft II. Здесь компьютер еще поддается человеку, но, вероятно, вскоре это будет исправлено.
Комментарии (51)
vassabi
29.05.2017 01:34+1«AlphaGo играет очень уверенно, и это придает уверенности мне. Это помогает мне верить, что я могу управлять ходом игры», — заявил Лянь Сяо
пфф! Разумеется, он был доволен ходом игры — он был единственным человеком, который закончил свою партию победой в эти пять дней. (ну и что, что это была парная игра, все равно — победа есть победа)
А уж сравнивая его с Кэ Цзе, который три раза проиграл — так вообще, небо и земля :)PS: В статье пропущен ещё момент, что команда АльфаГо подсластили пилюлю для Кэ Цзе — они пригласили его к себе в команду, играть с\против АльфаГо и при этом видеть не только ход самого компа, но и его внутреннее состояние — оценку хода и расчёты вариантов. Плюс, доступ к партиям, которые он играл сам против себя при обучении (и ещё по 10-5 партий выложить в открытый доступ для всех, но это конечно не тот масштаб… )
Syzd
29.05.2017 07:44-5Вот не разу не логично, может чемпион человек играет шаблонно, его стратегию изучили и написали бота который гарантированно обыгрывает его. Дайте возможность поиграть всем, мож его любые другие чемпионы в Го вынесут.
BlackMokona
29.05.2017 07:56+2Ноуп, Альфа Го не знал с кем играет. Плюс его уже выпускали в онлайн драться с профи и он всех укатал без труда.
Halt
29.05.2017 08:10+4Изучите хоть историю немного. Официальной встрече предшествовала серия из 60 партий, где AlphaGo под ником Master играл с самыми разными профессиональными игроками. Счет всей серии думаю объяснять не надо.
Но как говорят сами разработчики, это все капля в море. Основную силу AlphaGo набрал, играя с самим собой.
Here_and_Now
29.05.2017 08:34Потрясающее достижение для DeepMind. Я до конца так и не понял — система будет отключена? Или в онлайне будет продолжать играть как Master?
По поводу других применений — очень сложно будет собрать хорошие данные (для того же энергопотребления в масштабе мира). Может медицинские записи получше
Ommonick
29.05.2017 09:14А теперь натравите этот суперкомпьютер на доту
saege5b
29.05.2017 09:50Учитывая что за читерство везде наказывают вплоть до 'вечного' бана, то игра будет 'интересной'.
ariklus
29.05.2017 11:51Читерство? Насколько я знаю, использование ботов является читерством только если их вводят без преупреждения или выдают за игроков.
saege5b
30.05.2017 13:06Собственно интриги в такой игре особо и нет.
Иначе необходимо вводить километровый список ограничений для ИИ.
Кстати, не так давно у американцев проходила симуляция воздушного боя с использованием с одной стороны ИИ и реальных пилотов с другой. Для реальных пилотов там было всё печально.
ariklus
29.05.2017 11:52+3Обучать сильнейший ИИ основам психологической войны? Ню-ню.
alex4321
29.05.2017 13:44+1Да и overkill — опускать им шутки про мамок.
Alexey2005
29.05.2017 13:54Судя по тому, как медленно прогрессирует машинная обработка естественных языков, обучить ИИ шуткам про маму и тонкому троллингу будет на порядки сложнее, чем просто выигрывать.
Akon32
29.05.2017 14:01+1Интересно, троллинг какой толщины выберет нейросеть.
roboq6
29.05.2017 18:03Примерно такой толщины, который бы заставил игрока-человека на несколько секунд забыть об игре и быстренько что-то написать в чат. И чем чаще и дольше можно будет удержать игрока-человека в таком состоянии, тем оптимальней толщина троллинга.
Зачем это всё? Просто это повышает шансы ИИ на победу, ибо в RTS игрок будет больше отвлекаться на гавканье с ИИ, нежели на войнушку. А ведь ИИ может одновременно и в чат писать и войсками/экономикой управлять, что уже является преимуществом.
roboq6
29.05.2017 17:40А можно и не обучать троллингу, можно просто подключить модуль вполне прилично себя ведущего чат-бота чтобы ИИ «общался» в чате и таким образом отвлекал внимание от битвы игроков людей (или делал бы координацию их действий чуточку сложней из-за того что им пришлось бы мысленно отсеивать болтовню чат-бота). Как в одной истории про шахматиста из Техаса который заговаривал своему противнику зубы, и когда тот потерял из-за его болтовни внимательность поставил ему мат.
ariklus
30.05.2017 14:42От спама спасает команда mute player. То есть троллинг должен быть таким чтоб именно зацепить и вызвать отклик, а не просто заставить потратить пол секунды чтобы замьютить спамера.
Например «Ваша смарт-плита уже выпустила 15 кубометров газа и через 30 секунд его зажжет»roboq6
30.05.2017 14:56«Don't feed trolls» — правило старое, но увы люди им часто пренебрегают. Для многих людей промолчать в ответ на троллинг (в особенности если это прямое хамство или как-то затрагивает их ценности) это всё равно что молча сносить телесные побои, у многих чешутся руки чтобы «дать сдачи», пусть и словесной.
ariklus
30.05.2017 15:13Так способность переносить троллинг пропорциональна рейтингу. И если средний 12летний школьник забьет на игру и засядет за клаву строчить свой гнеффф от простого чат-бота с базой шуток про мамку, то профессионала уже прошибить сложнее
roboq6
30.05.2017 15:46Ну да, теоретически против профессионала данная стратегия будет малоэффективно (хотя ещё не факт, достаточно развитый ИИ может оказаться тонким психологом: http://rationalwiki.org/wiki/AI-box_experiment http://lesswrong.com/lw/1pz/the_ai_in_a_box_boxes_you/ ). Зато такая мета-стратегия повысит игровой рейтинг ИИ за счёт более слабых и темпераментных игроков.
ariklus
31.05.2017 15:33Так в том-то и шутка что ИИ будет обучаться все более изощренным и тонким методам троллинга, которые под конец позволят пронять даже профи )))
5oclock
31.05.2017 15:48А может наоборот, человеческие тролли расколят тонкую душевную организацию ИИ и вгонят его в депрессию? :)
roboq6
31.05.2017 17:05Тогда потребуется два игрока, один играет, а другой троллит ИИ в чате. В депрессию ИИ он конечно не вгонит, но возможно тот выболтает какую-нибудь информацию об своей базе/экономике (в общем а-ля «болтун — находка для шпиона»)
sumanai
29.05.2017 16:22Этот ИИ не сильнейший, он просто заточен под эту игру. Он даже не сможет отличить собаку от ягуара на фотографии, с чем не очень хорошо, но справляются другие нейросети.
saboteur_kiev
29.05.2017 14:18Зачем?
В любой игре, где требуется реакция и скорость клика, у машины автоматически появляется преимущество просто потому что у нее нет задержки.
Поэтому в реал-тайм играх не так приоритетно писать алгоритм, который думает над стратегией — зачем, если можно ВСЕГДА обыграть человека просто по скорости?Ommonick
29.05.2017 16:28Верно сказано, что машина может обыграть человека по скорости. Но как быть с вариантом хитрить, сыграть в фаст-раш, пять дагонов, грамотный сплит-пуш и т.д. Я бы не сказал что в доте скорость решит все
roboq6
29.05.2017 17:46зачем, если можно ВСЕГДА обыграть человека просто по скорости?
Чтобы обыграть человека с помощью суперскорости и сумасшедшего микро тоже нужны хорошие алгоритмы (по крайней мере в случае RTS). Ибо в противном случае мы бы видели как разработчики компьютерных игр разрешали бы компьютеру получать преимущество с помощью скорости. Но в реальности они просто программируют его на несколько шаблонов и дают тонны ресурсов. Ибо дать тонны ресурсов проще чем написать алгоритм эксплуатирующий параллелизм и суперскорость компа на полную катушку.saboteur_kiev
31.05.2017 15:40Вопрос в том, что если алгоритм начинает работать, человеку в принципе нечего этому противопоставить.
Таким образом, не появляется интерес сражаться с компьютером на равных. Каждый будет использовать свои алгоритмы, но при этому АИ будет продолжать учиться и перенимать у человека уже стратегические решения, а человек в принципе не способен освоить скорость кликов и реакцию на уровне компьютера.roboq6
31.05.2017 17:01Вопрос в том, что если алгоритм начинает работать, человеку в принципе нечего этому противопоставить.
До этого «если» надо ещё дожить. До этого же момент алгоритм будет временами откровенно тупить и проигрывать людям несмотря на всю свою суперскорость и параллелизм. Достичь же момента когда компьютер научится на полную катушку использовать свои возможности дабы сокрушить человеков и есть challenge (хотя потом можно будет поднять планку и ввести ограничения, дабы показать что ИИ может победить людей чисто интеллектуально).
Зачем?
В любой игре, где требуется реакция и скорость клика, у машины автоматически появляется преимущество просто потому что у нее нет задержки.
Ещё лично мне было бы интересно увидеть возникновение ассиметрии в игре вызванной разной природой игроков (в данном случае человек и машина). Какие чисто компьютерные (т.е. которые будет невозможно повторить игрокам-людям) стратегии возникнут в игре? Будут ли человеческие стратегии которые ИИ будет по каким-то причинам НЕспособен повторить? Смогут ли люди найти к ним контры и если да, то какие? Насколько сильно поломается игровой баланс который изначально расчитывался на игроков-людей и можно ли будет его поправить так, чтобы на равных могли играть и те и другие без ввода специальных ограничений для ИИ (вроде числа кликов в секунду)? Будут ли у ИИ специальные анти-человеческие (т.е. применяемые только против игроков-людей) стратегии? Будут ли у ИИ специальные стратегии применяемые только против других ИИ? Как игрок (человек или ИИ) будет определять против кого борется (человека или другого ИИ)? Как и те и другие будут пытаться выдать себя друг за друга (человек за ИИ, а ИИ за человека)? И как игроки будет бороться с попытками такого обмана? Возможна ли такая ситуация, что станет распространёной практика когда все игроки-люди с самого начала раскрываются что они люди и заключают между собой временный альянс против одного/двух ИИ?saboteur_kiev
31.05.2017 18:26Ну честно говоря не очень challenge. Этот Challenge очень зависит от игры.
Вводить число кликов в секунду — не поможет.
Везде где нужна точность и аккуратность, компьютер будет не просто кликать на максимальной скорости, а в принципе не будет промахиваться. У него не будет затекать рука, не будет случайных мисскликов, и клики будут не 10 раз в секунду, а в тот момент и тогда, когда это нужно.
Поэтому просто нет смысла писать алгоритм для подобных игр — разработчики, заинтересованные в выиграше, будут больше уделять внимание этим фичам, как бы «грамотно начитить», чем над стратегией решений.
5oclock
29.05.2017 09:45Следующий этап: когда человека обыграет система мощностью в 100Вт и конструктивным объёмом в пару литров :)
redpax
29.05.2017 11:13Ну чтож пошагово получилось, несомненно это серьзный результат но в переди новый рубеж SC2 в реальном времени.
Уважаемые комментаторы заранее прошу не скидывать видео с автоматоном который нечеловечески микрит юнитов, тема с микро уже обсуждалась и не раз в комментах к альфаГО и это решаемый вопрос.
ariklus
29.05.2017 11:53То есть добавить правило, ограничивающее кол-во полезных команд в секунду?
xPomaHx
29.05.2017 21:51Зачем вообще что то ограничивать? Если человек в силу био причин не может что то делать то это его проблемы, пусть использует сильные стороны свои а не перекликает компьютер. Либо вообще менять правила игры как то, но имхо даже с текущими правилами повторить что на видео было не получится, так как часто танки тупо невидно что они стреляют, и не предугадать куда попадет снаряд. Но если после изобретения ии будет такая проблема, близарды выпустят патч и анимация выстрела и попадания будет одновременно, чтобы исключить такой абуз.
shadovv76
29.05.2017 11:22+1отличные планы разработчиков.
указать ИИ как распространяются болезни среди людей и слабости энергетической системы.
ну и напоследок научить ее ведению войны.
Все это напоминает мне историю Нобеля и Оппенгеймера, которые вовремя остановиться не успели опьяненные своими возможностями.erwins22
29.05.2017 12:00задержка была бы год или два…
не они, так кто нибудь другой.
Прогресс не остановить
daiver19
29.05.2017 20:32Для начала, фраза «вся команда разработчиков всегда верила в то, что AlphaGo станет полезным для человечества» звучит, конечно, пафосно, но в ней упущен один момент — «полезным в игре го». Ничего другого эта программа не может в принципе. Ну и в целом в мире ИИ вроде прорывов она не сделала: reinforced learning и сверточные сети были вроде и до этого известны. Да, это крутое применение, но вокруг полно других примеров крутого применения НС.
Ну и главное: не нужен никакой ИИ чтобы, например, эксплуатировать слабости энергетической системы. Если она и вправду настолько уязвима, то достаточно старого доброго вируса.Camrad_RIP
30.05.2017 02:52Знаете, это как сказать Дженнер никакого прорыва в медицине не сделал. И до него было общеизвестным фактом что если переболеть оспой, то второй раз не заболеешь.
Cheater
29.05.2017 13:05+1Сломали закон «всегда найдётся азиат, который может круче» =(
Alexey2005
29.05.2017 13:52+2Уверены, что азиаты не смогут сделать копию AlphaGo, которая обыграет оригинал? В конце концов, сейчас самый мощный суперкомпьютер в мире именно у азиатов.
dom1n1k
29.05.2017 13:45Правда, ему тоже удалось добиться победы в одном из пяти матчей.
В партии. А матч — это вся серия из 5 партий.
AlexDodonov
30.05.2017 17:00А если, допустим, компьютер будет управлять роем военных дронов и проведёт миллион-другой виртуальных боёв с самим собой, то правильно ли я понимаю, что через некоторое время не найдётся человека, который смог бы разбить этот рой?
red75prim
30.05.2017 17:34Современные ИИ смогут победить только если человек будет играть по правилам. Например: не использовать постановщики помех, сети или веревки, подвешенные на дроны, какие-нибудь аэрозоли для блокирования камер и т.п.
demimurych
когда-нибудь внукам я буду рассказывать о том как все начиналось.
super-guest
надеюсь, не в бункере под землёй ;)