Пять профессиональных игроков в го не смогли ничего противопоставить натиску AlphaGo

Представители компании DeepMind на днях заявили о том, что игра с Кэ Цзе была последним сражением компьютерной системы AlphaGo с человеком. После победы во всех трех матчах подряд стало понятно, что с компьютером человеку уже не совладать, поэтому для системы играть с другими чемпионами в го просто нет смысла, исход будущих матчей можно считать предрешенным. По словам главы DeepMind Демиса Хассабиса, AlphaGo достигла уже всех возможных высот в го, поэтому время сменить профиль и попробовать себя в новой сфере.

Впервые весь мир услышал о компьютерном игроке в го чуть больше года назад, когда компьютер выиграл со счетом 4:1 у Ли Седоля, одного из чемпионов го. Никто не ожидал такого результата, поскольку эта игра считалась ранее сложной для компьютеров. Здесь огромное количество вариантов выбора хода, гораздо больше, чем в шахматах. По этой причине го считалась прерогативой человека. Но все меняется, компьютеры становятся совершеннее, так что современные программно-аппаратные платформы умеют то, чего не умели компьютеры всего пару-тройку лет назад.



Напомню, что два года назад AlphaGo обыграла чемпиона Европы, после чего, год спустя, выиграла уже у одного из чемпионов мира Ли Седоля. Правда, ему тоже удалось добиться победы в одном из пяти матчей. Сейчас, после проигрыша Кэ Цзе это дало повод говорить, что Ли Седоль — последний человек, которому удалось победить AlphaGo, пускай и единожды.

AlphaGo стала победителем во всех трех матчах с Кэ Цзе. В третьем матче китайский чемпион был вынужден сдаться, несмотря на то, что у него оставалось еще немногим более получаса на обдумывание ходов. Цзе играл белыми камнями, система — черными, так что первый ход сделала AlphaGo.


Не только Кэ Цзе не справился с мощью AlphaGo, не одолели систему и пять других мастеров, которые играли против компьютера впятером одновременно. Матч завершился полной победой ИИ-платформы от DeepMind. Еще система сражалась сама с собой, само собой, выиграла и проиграла одновременно.

Эксперты, следившие за ходом игры, утверждают, что профессионалы из мира го взяли на вооружение многие приемы, разработанные компьютером, которые и привели к победе системы.


«Команда AlphaGo теперь бросит все силы на преодоление новых высот, разрабатывая различные алгоритмы, которые однажды помогут ученым решить наиболее сложные проблемы, например, определить пути распространения заболеваний, снизить энергопотребление в глобальном масштабе или создать революционно новые материалы», — заявил глава DeepMind.

Также он сказал, что вся команда разработчиков всегда верила в то, что AlphaGo станет полезным для человечества. Например, эта система сможет помочь сделать какое-то открытие и извлечь из него пользу. А го — лишь пример того, на что способны современные технологии. Уже сейчас AlphaGo помог игрокам в го начать искать новые стратегические находки в игре, которые, в частности, использовал и Кэ Цзе. Определенно, это успех — ведь компьютер смог помочь найти новые интересные аспекты в игре, которой исполнилось уже 3000 лет.



Интересно, что AlphaGo не станет общедоступным сервисом (как, например, IBM Watson). Разработчики будут использовать систему пока в закрытом режиме, пытаясь найти полезные и нужные варианты ее использования. В скором будущем DeepMind опубликует документы о том, как эта система смогла достичь высот и какие технологии при этом использовались.

AlphaGo играла с людьми в рамках праздника го в китайском городе Вужень (провинция Чжэцзян). Первые две игры Кэ Цзе проиграл, так что уже после второго матча было понятно, что система выходит победителем, но оставалась еще и третья игра, участие в которой было делом чести для Цзэ.

Что касается стиля игры системы, то один из профессиональных игроков в го сказал, что считает игру AlphaGo «человеческой». «AlphaGo играет очень уверенно, и это придает уверенности мне. Это помогает мне верить, что я могу управлять ходом игры», — заявил Лянь Сяо.

Что будет делать AlphaGo дальше? Возможно, система начнет осваивать новые высоты в StarCraft II. Несколько месяцев назад создатели системы вместе с Blizzard объявили о намерении создать платформу для разработки ИИ-систем для игры в StarCraft II. Здесь компьютер еще поддается человеку, но, вероятно, вскоре это будет исправлено.
Поделиться с друзьями
-->

Комментарии (51)


  1. demimurych
    29.05.2017 00:32
    +3

    когда-нибудь внукам я буду рассказывать о том как все начиналось.


    1. super-guest
      29.05.2017 00:55
      +21

      надеюсь, не в бункере под землёй ;)


  1. vassabi
    29.05.2017 01:34
    +1

    «AlphaGo играет очень уверенно, и это придает уверенности мне. Это помогает мне верить, что я могу управлять ходом игры», — заявил Лянь Сяо
    пфф! Разумеется, он был доволен ходом игры — он был единственным человеком, который закончил свою партию победой в эти пять дней. (ну и что, что это была парная игра, все равно — победа есть победа)
    А уж сравнивая его с Кэ Цзе, который три раза проиграл — так вообще, небо и земля :)

    PS: В статье пропущен ещё момент, что команда АльфаГо подсластили пилюлю для Кэ Цзе — они пригласили его к себе в команду, играть с\против АльфаГо и при этом видеть не только ход самого компа, но и его внутреннее состояние — оценку хода и расчёты вариантов. Плюс, доступ к партиям, которые он играл сам против себя при обучении (и ещё по 10-5 партий выложить в открытый доступ для всех, но это конечно не тот масштаб… )


  1. Syzd
    29.05.2017 07:44
    -5

    Вот не разу не логично, может чемпион человек играет шаблонно, его стратегию изучили и написали бота который гарантированно обыгрывает его. Дайте возможность поиграть всем, мож его любые другие чемпионы в Го вынесут.


    1. BlackMokona
      29.05.2017 07:56
      +2

      Ноуп, Альфа Го не знал с кем играет. Плюс его уже выпускали в онлайн драться с профи и он всех укатал без труда.


    1. Halt
      29.05.2017 08:10
      +4

      Изучите хоть историю немного. Официальной встрече предшествовала серия из 60 партий, где AlphaGo под ником Master играл с самыми разными профессиональными игроками. Счет всей серии думаю объяснять не надо.

      Но как говорят сами разработчики, это все капля в море. Основную силу AlphaGo набрал, играя с самим собой.


  1. Here_and_Now
    29.05.2017 08:34

    Потрясающее достижение для DeepMind. Я до конца так и не понял — система будет отключена? Или в онлайне будет продолжать играть как Master?

    По поводу других применений — очень сложно будет собрать хорошие данные (для того же энергопотребления в масштабе мира). Может медицинские записи получше


  1. Ommonick
    29.05.2017 09:14

    А теперь натравите этот суперкомпьютер на доту


    1. saege5b
      29.05.2017 09:50

      Учитывая что за читерство везде наказывают вплоть до 'вечного' бана, то игра будет 'интересной'.


      1. ariklus
        29.05.2017 11:51

        Читерство? Насколько я знаю, использование ботов является читерством только если их вводят без преупреждения или выдают за игроков.


        1. saege5b
          30.05.2017 13:06

          Собственно интриги в такой игре особо и нет.
          Иначе необходимо вводить километровый список ограничений для ИИ.


          Кстати, не так давно у американцев проходила симуляция воздушного боя с использованием с одной стороны ИИ и реальных пилотов с другой. Для реальных пилотов там было всё печально.


    1. ariklus
      29.05.2017 11:52
      +3

      Обучать сильнейший ИИ основам психологической войны? Ню-ню.


      1. alex4321
        29.05.2017 13:44
        +1

        Да и overkill — опускать им шутки про мамок.


        1. Alexey2005
          29.05.2017 13:54

          Судя по тому, как медленно прогрессирует машинная обработка естественных языков, обучить ИИ шуткам про маму и тонкому троллингу будет на порядки сложнее, чем просто выигрывать.


          1. Akon32
            29.05.2017 14:01
            +1

            Интересно, троллинг какой толщины выберет нейросеть.


            1. roboq6
              29.05.2017 18:03

              Примерно такой толщины, который бы заставил игрока-человека на несколько секунд забыть об игре и быстренько что-то написать в чат. И чем чаще и дольше можно будет удержать игрока-человека в таком состоянии, тем оптимальней толщина троллинга.

              Зачем это всё? Просто это повышает шансы ИИ на победу, ибо в RTS игрок будет больше отвлекаться на гавканье с ИИ, нежели на войнушку. А ведь ИИ может одновременно и в чат писать и войсками/экономикой управлять, что уже является преимуществом.


          1. roboq6
            29.05.2017 17:40

            А можно и не обучать троллингу, можно просто подключить модуль вполне прилично себя ведущего чат-бота чтобы ИИ «общался» в чате и таким образом отвлекал внимание от битвы игроков людей (или делал бы координацию их действий чуточку сложней из-за того что им пришлось бы мысленно отсеивать болтовню чат-бота). Как в одной истории про шахматиста из Техаса который заговаривал своему противнику зубы, и когда тот потерял из-за его болтовни внимательность поставил ему мат.


            1. ariklus
              30.05.2017 14:42

              От спама спасает команда mute player. То есть троллинг должен быть таким чтоб именно зацепить и вызвать отклик, а не просто заставить потратить пол секунды чтобы замьютить спамера.

              Например «Ваша смарт-плита уже выпустила 15 кубометров газа и через 30 секунд его зажжет»


              1. roboq6
                30.05.2017 14:56

                «Don't feed trolls» — правило старое, но увы люди им часто пренебрегают. Для многих людей промолчать в ответ на троллинг (в особенности если это прямое хамство или как-то затрагивает их ценности) это всё равно что молча сносить телесные побои, у многих чешутся руки чтобы «дать сдачи», пусть и словесной.


                1. ariklus
                  30.05.2017 15:13

                  Так способность переносить троллинг пропорциональна рейтингу. И если средний 12летний школьник забьет на игру и засядет за клаву строчить свой гнеффф от простого чат-бота с базой шуток про мамку, то профессионала уже прошибить сложнее


                  1. roboq6
                    30.05.2017 15:46

                    Ну да, теоретически против профессионала данная стратегия будет малоэффективно (хотя ещё не факт, достаточно развитый ИИ может оказаться тонким психологом: http://rationalwiki.org/wiki/AI-box_experiment http://lesswrong.com/lw/1pz/the_ai_in_a_box_boxes_you/ ). Зато такая мета-стратегия повысит игровой рейтинг ИИ за счёт более слабых и темпераментных игроков.


                    1. ariklus
                      31.05.2017 15:33

                      Так в том-то и шутка что ИИ будет обучаться все более изощренным и тонким методам троллинга, которые под конец позволят пронять даже профи )))


                      1. 5oclock
                        31.05.2017 15:48

                        А может наоборот, человеческие тролли расколят тонкую душевную организацию ИИ и вгонят его в депрессию? :)


                        1. roboq6
                          31.05.2017 17:05

                          Тогда потребуется два игрока, один играет, а другой троллит ИИ в чате. В депрессию ИИ он конечно не вгонит, но возможно тот выболтает какую-нибудь информацию об своей базе/экономике (в общем а-ля «болтун — находка для шпиона»)


      1. sumanai
        29.05.2017 16:22

        Этот ИИ не сильнейший, он просто заточен под эту игру. Он даже не сможет отличить собаку от ягуара на фотографии, с чем не очень хорошо, но справляются другие нейросети.


    1. saboteur_kiev
      29.05.2017 14:18

      Зачем?
      В любой игре, где требуется реакция и скорость клика, у машины автоматически появляется преимущество просто потому что у нее нет задержки.
      Поэтому в реал-тайм играх не так приоритетно писать алгоритм, который думает над стратегией — зачем, если можно ВСЕГДА обыграть человека просто по скорости?


      1. Ommonick
        29.05.2017 16:28

        Верно сказано, что машина может обыграть человека по скорости. Но как быть с вариантом хитрить, сыграть в фаст-раш, пять дагонов, грамотный сплит-пуш и т.д. Я бы не сказал что в доте скорость решит все


      1. roboq6
        29.05.2017 17:46

        зачем, если можно ВСЕГДА обыграть человека просто по скорости?

        Чтобы обыграть человека с помощью суперскорости и сумасшедшего микро тоже нужны хорошие алгоритмы (по крайней мере в случае RTS). Ибо в противном случае мы бы видели как разработчики компьютерных игр разрешали бы компьютеру получать преимущество с помощью скорости. Но в реальности они просто программируют его на несколько шаблонов и дают тонны ресурсов. Ибо дать тонны ресурсов проще чем написать алгоритм эксплуатирующий параллелизм и суперскорость компа на полную катушку.


        1. saboteur_kiev
          31.05.2017 15:40

          Вопрос в том, что если алгоритм начинает работать, человеку в принципе нечего этому противопоставить.
          Таким образом, не появляется интерес сражаться с компьютером на равных. Каждый будет использовать свои алгоритмы, но при этому АИ будет продолжать учиться и перенимать у человека уже стратегические решения, а человек в принципе не способен освоить скорость кликов и реакцию на уровне компьютера.


          1. roboq6
            31.05.2017 17:01

            Вопрос в том, что если алгоритм начинает работать, человеку в принципе нечего этому противопоставить.
            До этого «если» надо ещё дожить. До этого же момент алгоритм будет временами откровенно тупить и проигрывать людям несмотря на всю свою суперскорость и параллелизм. Достичь же момента когда компьютер научится на полную катушку использовать свои возможности дабы сокрушить человеков и есть challenge (хотя потом можно будет поднять планку и ввести ограничения, дабы показать что ИИ может победить людей чисто интеллектуально).

            Зачем?
            В любой игре, где требуется реакция и скорость клика, у машины автоматически появляется преимущество просто потому что у нее нет задержки.

            Ещё лично мне было бы интересно увидеть возникновение ассиметрии в игре вызванной разной природой игроков (в данном случае человек и машина). Какие чисто компьютерные (т.е. которые будет невозможно повторить игрокам-людям) стратегии возникнут в игре? Будут ли человеческие стратегии которые ИИ будет по каким-то причинам НЕспособен повторить? Смогут ли люди найти к ним контры и если да, то какие? Насколько сильно поломается игровой баланс который изначально расчитывался на игроков-людей и можно ли будет его поправить так, чтобы на равных могли играть и те и другие без ввода специальных ограничений для ИИ (вроде числа кликов в секунду)? Будут ли у ИИ специальные анти-человеческие (т.е. применяемые только против игроков-людей) стратегии? Будут ли у ИИ специальные стратегии применяемые только против других ИИ? Как игрок (человек или ИИ) будет определять против кого борется (человека или другого ИИ)? Как и те и другие будут пытаться выдать себя друг за друга (человек за ИИ, а ИИ за человека)? И как игроки будет бороться с попытками такого обмана? Возможна ли такая ситуация, что станет распространёной практика когда все игроки-люди с самого начала раскрываются что они люди и заключают между собой временный альянс против одного/двух ИИ?


            1. saboteur_kiev
              31.05.2017 18:26

              Ну честно говоря не очень challenge. Этот Challenge очень зависит от игры.

              Вводить число кликов в секунду — не поможет.

              Везде где нужна точность и аккуратность, компьютер будет не просто кликать на максимальной скорости, а в принципе не будет промахиваться. У него не будет затекать рука, не будет случайных мисскликов, и клики будут не 10 раз в секунду, а в тот момент и тогда, когда это нужно.

              Поэтому просто нет смысла писать алгоритм для подобных игр — разработчики, заинтересованные в выиграше, будут больше уделять внимание этим фичам, как бы «грамотно начитить», чем над стратегией решений.


  1. 5oclock
    29.05.2017 09:45

    Следующий этап: когда человека обыграет система мощностью в 100Вт и конструктивным объёмом в пару литров :)


  1. erwins22
    29.05.2017 10:00
    -1

    интетересно, а рейтинг у этой системы бесконечность?


  1. zookko
    29.05.2017 10:39
    -2

    Пусть попробует моего деда в переводного дурака обыграть.


  1. Ugrum
    29.05.2017 10:56
    +1

    AlphaGo уходит из го

    Надоело ему с детьми в песочнице.


  1. redpax
    29.05.2017 11:13

    Ну чтож пошагово получилось, несомненно это серьзный результат но в переди новый рубеж SC2 в реальном времени.


    Уважаемые комментаторы заранее прошу не скидывать видео с автоматоном который нечеловечески микрит юнитов, тема с микро уже обсуждалась и не раз в комментах к альфаГО и это решаемый вопрос.


    1. ariklus
      29.05.2017 11:53

      То есть добавить правило, ограничивающее кол-во полезных команд в секунду?


      1. KvanTTT
        29.05.2017 12:05
        +1

        Не полезных, а всех. Как узнать, что команда была полезной?


      1. xPomaHx
        29.05.2017 21:51

        Зачем вообще что то ограничивать? Если человек в силу био причин не может что то делать то это его проблемы, пусть использует сильные стороны свои а не перекликает компьютер. Либо вообще менять правила игры как то, но имхо даже с текущими правилами повторить что на видео было не получится, так как часто танки тупо невидно что они стреляют, и не предугадать куда попадет снаряд. Но если после изобретения ии будет такая проблема, близарды выпустят патч и анимация выстрела и попадания будет одновременно, чтобы исключить такой абуз.


  1. shadovv76
    29.05.2017 11:22
    +1

    отличные планы разработчиков.
    указать ИИ как распространяются болезни среди людей и слабости энергетической системы.
    ну и напоследок научить ее ведению войны.
    Все это напоминает мне историю Нобеля и Оппенгеймера, которые вовремя остановиться не успели опьяненные своими возможностями.


    1. erwins22
      29.05.2017 12:00

      задержка была бы год или два…
      не они, так кто нибудь другой.
      Прогресс не остановить


    1. daiver19
      29.05.2017 20:32

      Для начала, фраза «вся команда разработчиков всегда верила в то, что AlphaGo станет полезным для человечества» звучит, конечно, пафосно, но в ней упущен один момент — «полезным в игре го». Ничего другого эта программа не может в принципе. Ну и в целом в мире ИИ вроде прорывов она не сделала: reinforced learning и сверточные сети были вроде и до этого известны. Да, это крутое применение, но вокруг полно других примеров крутого применения НС.
      Ну и главное: не нужен никакой ИИ чтобы, например, эксплуатировать слабости энергетической системы. Если она и вправду настолько уязвима, то достаточно старого доброго вируса.


      1. xPomaHx
        29.05.2017 21:52

        Очередной разговор о полезности полетов в космос 50 лет назад.


      1. Camrad_RIP
        30.05.2017 02:52

        Знаете, это как сказать Дженнер никакого прорыва в медицине не сделал. И до него было общеизвестным фактом что если переболеть оспой, то второй раз не заболеешь.


  1. Cheater
    29.05.2017 13:05
    +1

    Сломали закон «всегда найдётся азиат, который может круче» =(


    1. alex4321
      29.05.2017 13:45

      Надо пилить киборга-азиата.


    1. Alexey2005
      29.05.2017 13:52
      +2

      Уверены, что азиаты не смогут сделать копию AlphaGo, которая обыграет оригинал? В конце концов, сейчас самый мощный суперкомпьютер в мире именно у азиатов.


      1. red75prim
        30.05.2017 08:40

        Уже сделали: FineArt компании Tencent. Но уровень игры пока ниже чем у AlphaGo — людям иногда проигрывает.


  1. dom1n1k
    29.05.2017 13:45

    Правда, ему тоже удалось добиться победы в одном из пяти матчей.

    В партии. А матч — это вся серия из 5 партий.


  1. AlexDodonov
    30.05.2017 17:00

    А если, допустим, компьютер будет управлять роем военных дронов и проведёт миллион-другой виртуальных боёв с самим собой, то правильно ли я понимаю, что через некоторое время не найдётся человека, который смог бы разбить этот рой?


    1. red75prim
      30.05.2017 17:34

      Современные ИИ смогут победить только если человек будет играть по правилам. Например: не использовать постановщики помех, сети или веревки, подвешенные на дроны, какие-нибудь аэрозоли для блокирования камер и т.п.