AlphaGo уходит из го после победы «всухую» в серии матчей с чемпионом мира / forpes.ru

Главная
AlphaGo уходит из го после победы «всухую» в серии матчей с чемпионом мира

AlphaGo уходит из го после победы «всухую» в серии матчей с чемпионом мира +34

28.05.2017 20:01

marks 51 16400 Источник

Пять профессиональных игроков в го не смогли ничего противопоставить натиску AlphaGo

Представители компании DeepMind на днях заявили о том, что игра с Кэ Цзе была последним сражением компьютерной системы AlphaGo с человеком. После победы во всех трех матчах подряд стало понятно, что с компьютером человеку уже не совладать, поэтому для системы играть с другими чемпионами в го просто нет смысла, исход будущих матчей можно считать предрешенным. По словам главы DeepMind Демиса Хассабиса, AlphaGo достигла уже всех возможных высот в го, поэтому время сменить профиль и попробовать себя в новой сфере.

Впервые весь мир услышал о компьютерном игроке в го чуть больше года назад, когда компьютер выиграл со счетом 4:1 у Ли Седоля, одного из чемпионов го. Никто не ожидал такого результата, поскольку эта игра считалась ранее сложной для компьютеров. Здесь огромное количество вариантов выбора хода, гораздо больше, чем в шахматах. По этой причине го считалась прерогативой человека. Но все меняется, компьютеры становятся совершеннее, так что современные программно-аппаратные платформы умеют то, чего не умели компьютеры всего пару-тройку лет назад.

Напомню, что два года назад AlphaGo обыграла чемпиона Европы, после чего, год спустя, выиграла уже у одного из чемпионов мира Ли Седоля. Правда, ему тоже удалось добиться победы в одном из пяти матчей. Сейчас, после проигрыша Кэ Цзе это дало повод говорить, что Ли Седоль — последний человек, которому удалось победить AlphaGo, пускай и единожды.

AlphaGo стала победителем во всех трех матчах с Кэ Цзе. В третьем матче китайский чемпион был вынужден сдаться, несмотря на то, что у него оставалось еще немногим более получаса на обдумывание ходов. Цзе играл белыми камнями, система — черными, так что первый ход сделала AlphaGo.

Не только Кэ Цзе не справился с мощью AlphaGo, не одолели систему и пять других мастеров, которые играли против компьютера впятером одновременно. Матч завершился полной победой ИИ-платформы от DeepMind. Еще система сражалась сама с собой, само собой, выиграла и проиграла одновременно.

Эксперты, следившие за ходом игры, утверждают, что профессионалы из мира го взяли на вооружение многие приемы, разработанные компьютером, которые и привели к победе системы.

This speaks volumes about where AI is headed - human players are teaming up with AlphaGo to have even more fun with the game! https://t.co/42X58NvEga
— Eric Schmidt (@ericschmidt) May 26, 2017

«Команда AlphaGo теперь бросит все силы на преодоление новых высот, разрабатывая различные алгоритмы, которые однажды помогут ученым решить наиболее сложные проблемы, например, определить пути распространения заболеваний, снизить энергопотребление в глобальном масштабе или создать революционно новые материалы», — заявил глава DeepMind.

Также он сказал, что вся команда разработчиков всегда верила в то, что AlphaGo станет полезным для человечества. Например, эта система сможет помочь сделать какое-то открытие и извлечь из него пользу. А го — лишь пример того, на что способны современные технологии. Уже сейчас AlphaGo помог игрокам в го начать искать новые стратегические находки в игре, которые, в частности, использовал и Кэ Цзе. Определенно, это успех — ведь компьютер смог помочь найти новые интересные аспекты в игре, которой исполнилось уже 3000 лет.

Интересно, что AlphaGo не станет общедоступным сервисом (как, например, IBM Watson). Разработчики будут использовать систему пока в закрытом режиме, пытаясь найти полезные и нужные варианты ее использования. В скором будущем DeepMind опубликует документы о том, как эта система смогла достичь высот и какие технологии при этом использовались.

AlphaGo играла с людьми в рамках праздника го в китайском городе Вужень (провинция Чжэцзян). Первые две игры Кэ Цзе проиграл, так что уже после второго матча было понятно, что система выходит победителем, но оставалась еще и третья игра, участие в которой было делом чести для Цзэ.

Что касается стиля игры системы, то один из профессиональных игроков в го сказал, что считает игру AlphaGo «человеческой». «AlphaGo играет очень уверенно, и это придает уверенности мне. Это помогает мне верить, что я могу управлять ходом игры», — заявил Лянь Сяо.

Что будет делать AlphaGo дальше? Возможно, система начнет осваивать новые высоты в StarCraft II. Несколько месяцев назад создатели системы вместе с Blizzard объявили о намерении создать платформу для разработки ИИ-систем для игры в StarCraft II. Здесь компьютер еще поддается человеку, но, вероятно, вскоре это будет исправлено.

Поделиться с друзьями

-->

Комментарии (51)

demimurych
29.05.2017 00:32
#10093589
+3
когда-нибудь внукам я буду рассказывать о том как все начиналось.
1. super-guest
  29.05.2017 00:55
  #10093597
  +21
  надеюсь, не в бункере под землёй ;)

vassabi
29.05.2017 01:34
#10093615
+1
«AlphaGo играет очень уверенно, и это придает уверенности мне. Это помогает мне верить, что я могу управлять ходом игры», — заявил Лянь Сяо
пфф! Разумеется, он был доволен ходом игры — он был единственным человеком, который закончил свою партию победой в эти пять дней. (ну и что, что это была парная игра, все равно — победа есть победа)
А уж сравнивая его с Кэ Цзе, который три раза проиграл — так вообще, небо и земля :)
PS: В статье пропущен ещё момент, что команда АльфаГо подсластили пилюлю для Кэ Цзе — они пригласили его к себе в команду, играть с\против АльфаГо и при этом видеть не только ход самого компа, но и его внутреннее состояние — оценку хода и расчёты вариантов. Плюс, доступ к партиям, которые он играл сам против себя при обучении (и ещё по 10-5 партий выложить в открытый доступ для всех, но это конечно не тот масштаб… )

Syzd
29.05.2017 07:44
#10093699
-5
Вот не разу не логично, может чемпион человек играет шаблонно, его стратегию изучили и написали бота который гарантированно обыгрывает его. Дайте возможность поиграть всем, мож его любые другие чемпионы в Го вынесут.
1. BlackMokona
  29.05.2017 07:56
  #10093705
  +2
  Ноуп, Альфа Го не знал с кем играет. Плюс его уже выпускали в онлайн драться с профи и он всех укатал без труда.
1. Halt
  29.05.2017 08:10
  #10093713
  +4
  Изучите хоть историю немного. Официальной встрече предшествовала серия из 60 партий, где AlphaGo под ником Master играл с самыми разными профессиональными игроками. Счет всей серии думаю объяснять не надо.
  
  Но как говорят сами разработчики, это все капля в море. Основную силу AlphaGo набрал, играя с самим собой.

Here_and_Now
29.05.2017 08:34
#10093729
Потрясающее достижение для DeepMind. Я до конца так и не понял — система будет отключена? Или в онлайне будет продолжать играть как Master?

По поводу других применений — очень сложно будет собрать хорошие данные (для того же энергопотребления в масштабе мира). Может медицинские записи получше

Ommonick
29.05.2017 09:14
#10093759
А теперь натравите этот суперкомпьютер на доту
1. saege5b
  29.05.2017 09:50
  #10093865
  Учитывая что за читерство везде наказывают вплоть до 'вечного' бана, то игра будет 'интересной'.
  1. ariklus
    29.05.2017 11:51
    #10094367
    Читерство? Насколько я знаю, использование ботов является читерством только если их вводят без преупреждения или выдают за игроков.
    
    saege5b
    30.05.2017 13:06
    #10098233
    Собственно интриги в такой игре особо и нет.
    Иначе необходимо вводить километровый список ограничений для ИИ.
    
    Кстати, не так давно у американцев проходила симуляция воздушного боя с использованием с одной стороны ИИ и реальных пилотов с другой. Для реальных пилотов там было всё печально.
1. ariklus
  29.05.2017 11:52
  #10094369
  +3
  Обучать сильнейший ИИ основам психологической войны? Ню-ню.
  1. alex4321
    29.05.2017 13:44
    #10094731
    +1
    Да и overkill — опускать им шутки про мамок.
    
    Alexey2005
    29.05.2017 13:54
    #10094769
    Судя по тому, как медленно прогрессирует машинная обработка естественных языков, обучить ИИ шуткам про маму и тонкому троллингу будет на порядки сложнее, чем просто выигрывать.
    
    Akon32
    29.05.2017 14:01
    #10094791
    +1
    Интересно, троллинг какой толщины выберет нейросеть.
    
    roboq6
    29.05.2017 18:03
    #10095913
    Примерно такой толщины, который бы заставил игрока-человека на несколько секунд забыть об игре и быстренько что-то написать в чат. И чем чаще и дольше можно будет удержать игрока-человека в таком состоянии, тем оптимальней толщина троллинга.
    
    Зачем это всё? Просто это повышает шансы ИИ на победу, ибо в RTS игрок будет больше отвлекаться на гавканье с ИИ, нежели на войнушку. А ведь ИИ может одновременно и в чат писать и войсками/экономикой управлять, что уже является преимуществом.
    
    roboq6
    29.05.2017 17:40
    #10095817
    А можно и не обучать троллингу, можно просто подключить модуль вполне прилично себя ведущего чат-бота чтобы ИИ «общался» в чате и таким образом отвлекал внимание от битвы игроков людей (или делал бы координацию их действий чуточку сложней из-за того что им пришлось бы мысленно отсеивать болтовню чат-бота). Как в одной истории про шахматиста из Техаса который заговаривал своему противнику зубы, и когда тот потерял из-за его болтовни внимательность поставил ему мат.
    
    ariklus
    30.05.2017 14:42
    #10098593
    От спама спасает команда mute player. То есть троллинг должен быть таким чтоб именно зацепить и вызвать отклик, а не просто заставить потратить пол секунды чтобы замьютить спамера.
    
    Например «Ваша смарт-плита уже выпустила 15 кубометров газа и через 30 секунд его зажжет»
    
    roboq6
    30.05.2017 14:56
    #10098661
    «Don't feed trolls» — правило старое, но увы люди им часто пренебрегают. Для многих людей промолчать в ответ на троллинг (в особенности если это прямое хамство или как-то затрагивает их ценности) это всё равно что молча сносить телесные побои, у многих чешутся руки чтобы «дать сдачи», пусть и словесной.
    
    ariklus
    30.05.2017 15:13
    #10098743
    Так способность переносить троллинг пропорциональна рейтингу. И если средний 12летний школьник забьет на игру и засядет за клаву строчить свой гнеффф от простого чат-бота с базой шуток про мамку, то профессионала уже прошибить сложнее
    
    roboq6
    30.05.2017 15:46
    #10098893
    Ну да, теоретически против профессионала данная стратегия будет малоэффективно (хотя ещё не факт, достаточно развитый ИИ может оказаться тонким психологом: http://rationalwiki.org/wiki/AI-box_experiment http://lesswrong.com/lw/1pz/the_ai_in_a_box_boxes_you/ ). Зато такая мета-стратегия повысит игровой рейтинг ИИ за счёт более слабых и темпераментных игроков.
    
    ariklus
    31.05.2017 15:33
    #10102169
    Так в том-то и шутка что ИИ будет обучаться все более изощренным и тонким методам троллинга, которые под конец позволят пронять даже профи )))
    
    5oclock
    31.05.2017 15:48
    #10102231
    А может наоборот, человеческие тролли расколят тонкую душевную организацию ИИ и вгонят его в депрессию? :)
    
    roboq6
    31.05.2017 17:05
    #10102545
    Тогда потребуется два игрока, один играет, а другой троллит ИИ в чате. В депрессию ИИ он конечно не вгонит, но возможно тот выболтает какую-нибудь информацию об своей базе/экономике (в общем а-ля «болтун — находка для шпиона»)
  1. sumanai
    29.05.2017 16:22
    #10095429
    Этот ИИ не сильнейший, он просто заточен под эту игру. Он даже не сможет отличить собаку от ягуара на фотографии, с чем не очень хорошо, но справляются другие нейросети.
1. saboteur_kiev
  29.05.2017 14:18
  #10094855
  Зачем?
  В любой игре, где требуется реакция и скорость клика, у машины автоматически появляется преимущество просто потому что у нее нет задержки.
  Поэтому в реал-тайм играх не так приоритетно писать алгоритм, который думает над стратегией — зачем, если можно ВСЕГДА обыграть человека просто по скорости?
  1. Ommonick
    29.05.2017 16:28
    #10095473
    Верно сказано, что машина может обыграть человека по скорости. Но как быть с вариантом хитрить, сыграть в фаст-раш, пять дагонов, грамотный сплит-пуш и т.д. Я бы не сказал что в доте скорость решит все
  1. roboq6
    29.05.2017 17:46
    #10095839
    зачем, если можно ВСЕГДА обыграть человека просто по скорости?
    
    Чтобы обыграть человека с помощью суперскорости и сумасшедшего микро тоже нужны хорошие алгоритмы (по крайней мере в случае RTS). Ибо в противном случае мы бы видели как разработчики компьютерных игр разрешали бы компьютеру получать преимущество с помощью скорости. Но в реальности они просто программируют его на несколько шаблонов и дают тонны ресурсов. Ибо дать тонны ресурсов проще чем написать алгоритм эксплуатирующий параллелизм и суперскорость компа на полную катушку.
    
    saboteur_kiev
    31.05.2017 15:40
    #10102193
    Вопрос в том, что если алгоритм начинает работать, человеку в принципе нечего этому противопоставить.
    Таким образом, не появляется интерес сражаться с компьютером на равных. Каждый будет использовать свои алгоритмы, но при этому АИ будет продолжать учиться и перенимать у человека уже стратегические решения, а человек в принципе не способен освоить скорость кликов и реакцию на уровне компьютера.
    
    roboq6
    31.05.2017 17:01
    #10102531
    Вопрос в том, что если алгоритм начинает работать, человеку в принципе нечего этому противопоставить.
    До этого «если» надо ещё дожить. До этого же момент алгоритм будет временами откровенно тупить и проигрывать людям несмотря на всю свою суперскорость и параллелизм. Достичь же момента когда компьютер научится на полную катушку использовать свои возможности дабы сокрушить человеков и есть challenge (хотя потом можно будет поднять планку и ввести ограничения, дабы показать что ИИ может победить людей чисто интеллектуально).
    
    Зачем?
    В любой игре, где требуется реакция и скорость клика, у машины автоматически появляется преимущество просто потому что у нее нет задержки.
    
    Ещё лично мне было бы интересно увидеть возникновение ассиметрии в игре вызванной разной природой игроков (в данном случае человек и машина). Какие чисто компьютерные (т.е. которые будет невозможно повторить игрокам-людям) стратегии возникнут в игре? Будут ли человеческие стратегии которые ИИ будет по каким-то причинам НЕспособен повторить? Смогут ли люди найти к ним контры и если да, то какие? Насколько сильно поломается игровой баланс который изначально расчитывался на игроков-людей и можно ли будет его поправить так, чтобы на равных могли играть и те и другие без ввода специальных ограничений для ИИ (вроде числа кликов в секунду)? Будут ли у ИИ специальные анти-человеческие (т.е. применяемые только против игроков-людей) стратегии? Будут ли у ИИ специальные стратегии применяемые только против других ИИ? Как игрок (человек или ИИ) будет определять против кого борется (человека или другого ИИ)? Как и те и другие будут пытаться выдать себя друг за друга (человек за ИИ, а ИИ за человека)? И как игроки будет бороться с попытками такого обмана? Возможна ли такая ситуация, что станет распространёной практика когда все игроки-люди с самого начала раскрываются что они люди и заключают между собой временный альянс против одного/двух ИИ?
    
    saboteur_kiev
    31.05.2017 18:26
    #10102797
    Ну честно говоря не очень challenge. Этот Challenge очень зависит от игры.
    
    Вводить число кликов в секунду — не поможет.
    
    Везде где нужна точность и аккуратность, компьютер будет не просто кликать на максимальной скорости, а в принципе не будет промахиваться. У него не будет затекать рука, не будет случайных мисскликов, и клики будут не 10 раз в секунду, а в тот момент и тогда, когда это нужно.
    
    Поэтому просто нет смысла писать алгоритм для подобных игр — разработчики, заинтересованные в выиграше, будут больше уделять внимание этим фичам, как бы «грамотно начитить», чем над стратегией решений.

5oclock
29.05.2017 09:45
#10093843
Следующий этап: когда человека обыграет система мощностью в 100Вт и конструктивным объёмом в пару литров :)

erwins22
29.05.2017 10:00
#10093901
-1
интетересно, а рейтинг у этой системы бесконечность?

zookko
29.05.2017 10:39
#10094045
-2
Пусть попробует моего деда в переводного дурака обыграть.

Ugrum
29.05.2017 10:56
#10094177
+1
AlphaGo уходит из го
Надоело ему с детьми в песочнице.

redpax
29.05.2017 11:13
#10094249
Ну чтож пошагово получилось, несомненно это серьзный результат но в переди новый рубеж SC2 в реальном времени.

Уважаемые комментаторы заранее прошу не скидывать видео с автоматоном который нечеловечески микрит юнитов, тема с микро уже обсуждалась и не раз в комментах к альфаГО и это решаемый вопрос.
1. ariklus
  29.05.2017 11:53
  #10094379
  То есть добавить правило, ограничивающее кол-во полезных команд в секунду?
  1. KvanTTT
    29.05.2017 12:05
    #10094425
    +1
    Не полезных, а всех. Как узнать, что команда была полезной?
  1. xPomaHx
    29.05.2017 21:51
    #10096541
    Зачем вообще что то ограничивать? Если человек в силу био причин не может что то делать то это его проблемы, пусть использует сильные стороны свои а не перекликает компьютер. Либо вообще менять правила игры как то, но имхо даже с текущими правилами повторить что на видео было не получится, так как часто танки тупо невидно что они стреляют, и не предугадать куда попадет снаряд. Но если после изобретения ии будет такая проблема, близарды выпустят патч и анимация выстрела и попадания будет одновременно, чтобы исключить такой абуз.

shadovv76
29.05.2017 11:22
#10094277
+1
отличные планы разработчиков.
указать ИИ как распространяются болезни среди людей и слабости энергетической системы.
ну и напоследок научить ее ведению войны.
Все это напоминает мне историю Нобеля и Оппенгеймера, которые вовремя остановиться не успели опьяненные своими возможностями.
1. erwins22
  29.05.2017 12:00
  #10094409
  задержка была бы год или два…
  не они, так кто нибудь другой.
  Прогресс не остановить
1. daiver19
  29.05.2017 20:32
  #10096351
  Для начала, фраза «вся команда разработчиков всегда верила в то, что AlphaGo станет полезным для человечества» звучит, конечно, пафосно, но в ней упущен один момент — «полезным в игре го». Ничего другого эта программа не может в принципе. Ну и в целом в мире ИИ вроде прорывов она не сделала: reinforced learning и сверточные сети были вроде и до этого известны. Да, это крутое применение, но вокруг полно других примеров крутого применения НС.
  Ну и главное: не нужен никакой ИИ чтобы, например, эксплуатировать слабости энергетической системы. Если она и вправду настолько уязвима, то достаточно старого доброго вируса.
  1. xPomaHx
    29.05.2017 21:52
    #10096549
    Очередной разговор о полезности полетов в космос 50 лет назад.
  1. Camrad_RIP
    30.05.2017 02:52
    #10097065
    Знаете, это как сказать Дженнер никакого прорыва в медицине не сделал. И до него было общеизвестным фактом что если переболеть оспой, то второй раз не заболеешь.

Cheater
29.05.2017 13:05
#10094609
+1
Сломали закон «всегда найдётся азиат, который может круче» =(
1. alex4321
  29.05.2017 13:45
  #10094741
  Надо пилить киборга-азиата.
1. Alexey2005
  29.05.2017 13:52
  #10094761
  +2
  Уверены, что азиаты не смогут сделать копию AlphaGo, которая обыграет оригинал? В конце концов, сейчас самый мощный суперкомпьютер в мире именно у азиатов.
  1. red75prim
    30.05.2017 08:40
    #10097363
    Уже сделали: FineArt компании Tencent. Но уровень игры пока ниже чем у AlphaGo — людям иногда проигрывает.

dom1n1k
29.05.2017 13:45
#10094737
Правда, ему тоже удалось добиться победы в одном из пяти матчей.

В партии. А матч — это вся серия из 5 партий.

AlexDodonov
30.05.2017 17:00
#10099213
А если, допустим, компьютер будет управлять роем военных дронов и проведёт миллион-другой виртуальных боёв с самим собой, то правильно ли я понимаю, что через некоторое время не найдётся человека, который смог бы разбить этот рой?
1. red75prim
  30.05.2017 17:34
  #10099303
  Современные ИИ смогут победить только если человек будет играть по правилам. Например: не использовать постановщики помех, сети или веревки, подвешенные на дроны, какие-нибудь аэрозоли для блокирования камер и т.п.