Сможет ли человек победить искусственный интеллект в го на этот раз?


Будет ли Кэ Цзе выглядеть таким же довольным после игры с компьютером?

В марте этого года один из лучших игроков мира в го Ли Седоль провел несколько игр с AlphaGo, системой компьютерного го. Эта система состоит, грубо говоря, из комбинации метода Монте-Карло и нейросетей политики (policy networks) и ценности (value networks). Для того, чтобы выйти на текущий уровень мастерства, AlphaGo играла в го сотни тысяч раз (речь идет примерно о 160 тысячах уже сыгранных партий). Сами партии брались с сервера KGS, где играют мастера от шестого до девятого дана. Система самообучалась, причем во многом — благодаря оригинальной системе обучения с подкреплением. Первая сеть политики играла с людьми, вторая — играла с первой, оптимизируя ее. Это делалось для того, чтобы система стремилась выиграть, а не просто предсказывать ходы. И такая система вполне себя оправдала.

Дело в том, что го — это игра с огромным числом возможных позиций камней на стандартной доске. Таких позиций примерно в гугол (10100) раз больше, чем в шахматах. Это даже больше, чем число атомов во всей Вселенной. Именно поэтому го считалась игрой, обучить которой искусственный интеллект очень сложно, если вообще возможно. Но, как видим, вполне возможно. А на первый взгляд все очень просто = на доске 19*19 линий игроки располагают камни двух цветов, и начинают попытки занять камнями своего цвета площадь больше, чем соперник. Надо сказать, что до AlphaGo были и другие программы — но они играли на уровне любителя, а не мастера, тем более, 9 дана. Но AlphaGo удалось победить чемпиона Европы, а также одного из пяти сильнейших игроков мира Ли Седоля.

Надо сказать, что Седоль действительно сильный игрок, который получил первый профессиональный дан в 1996 году, когда ему было всего 13 лет. Ему принадлежит уже 18 различных титулов международного значения. Естественно, видя первые попытки AlphaGo играть с людьми, Седоль решил, что система играет довольно слабо. И он довольно быстро согласился поучаствовать в серии игр с AlphaGo. Изначально Седоль утверждал, что без проблем выиграет у компьютерной системы со счетом 4:1 или даже 5:0. Но ситуация вышла из-под его контроля, выигрывать начал как раз компьютер. По итогам всех пяти игр победителем вышла система AlphaGo. Если бы Ли Седоль выиграл бы у AlphaGo, он бы получил миллионов долларов США. Но он проиграл, и миллион призового фонда ушел на благотворительность. Призовой фонд проигравшему составил 170 тысяч долларов. Из них 150 тысяч — за участие, и 20 тысяч — за победу.

Игра 1

Чёрные: Ли Седоль
Белые: AlphaGo
Результат: Ли Седоль признал поражение
Ходов: 186

Игра 2

Чёрные: AlphaGo
Белые: Ли Седоль
Результат: Ли Седоль признал поражение
Ходов: 211

Игра 3

Чёрные: Ли Седоль
Белые: AlphaGo
Результат: Ли Седоль признал поражение
Ходов: 176

Игра 4

Чёрные: AlphaGo
Белые: Ли Седоль
Результат: AlphaGo признала поражение
Ходов: 180

Игра 5

Чёрные: Ли Седоль
Белые: AlphaGo
Результат: Ли Седоль признал поражение
Ходов: 280

Что теперь?

Таким образом, Ли Седоль выиграл только один раз. После серии побед AlphaGO получила почетный девятый профессиональный дан от «Корейской ассоциации падук». И сейчас компьютерный игрок высшего уровня может сыграть с китайским чемпионом, мастером го девятого дана Ке Цзе. Он, к слову, несколько раз победил Ли Седоля. Ке Цзе — гений в мире го, и он утверждает, что вероятность его выигрыша у AlphaGo составляет около 60%. Вероятно, Цзе знает, что говорит. Судите сами.

Он начал учиться играть в го в возрасте 5 лет, его учителем был Чжоу Цзунцян (???). В 2007 впервые выиграл в Национальном чемпионате. В 2008 году получил разряд 1 профессионального дана, а в 2015 — 9 дан. В январе 2015 завоевал свой первый международный титул чемпиона мира во втором Bailing Cup, победив Цю Цзюнь. С этой победой Кэ Цзе стал самым молодым действующим чемпионом мира.

В декабре 2015 разгромил Ши Юэ (Shi Yue) и стал победителем 20-го кубка Samsung. Таким образом, он является обладателем двух крупных международных титулов, полученных за один год, впервые с 2011 года, когда аналогичный результат показал Ли Седоль.

Третий международный титул Кэ Цзе получил в январе 2016 победой во 2-ом Meng Baihe Cup, взяв верх над прославленным южно-корейским игроком в го Ли Седолем. Хотя разрыв по очкам у соперников был минимальный, и при использовании другой системы подсчета очков выиграл бы Ли. Этот титул делает его четвёртым китайским профессиональным игроком в го, выигравшим три международных титула, наряду с Гу Ли, Кун Цзе, Чан Хао. В марте 2016 он еще раз встретился с Ли на 17-ом Nongshim Cup и также выиграл у него со счетом 7-2.



Цзе собирается сыграть с AlphaGo в октябре этого года, в Китае, провинция Хайнань. Соответствующая информация появилась в официальном фан-клубе Цзе в китайском аналоге Twitter, Sina Weibo.

Интересно, что сразу после игры с Седолем AlphaGo набрала 3533 очков, что позволило системе занять четвертое место в общемировом рейтинге игроков го. С тех пор компьютерная система поднялась еще выше, заняв второе место. Первое место сейчас занимает Кэ Цзе. Если компьютер выиграет — чемпионом мира станет машина. Если до матча с Седолем специалисты спорили в плане того, если у машины шанс победить человека, то теперь можно не спорить. Вероятность победы компьютера довольно велика.

Текущий рейтинг мастеров го с 1 по 25 место

Rank Name >+ Flag Elo
1 Ke Jie > cn 3625
2 Google DeepMind AlphaGo gb 3605
3 Park Junghwan > kr 3586
4 Lee Sedol > kr 3545
5 Shi Yue > cn 3529
6 Mi Yuting > cn 3526
7 Iyama Yuta > jp 3523
8 Park Yeonghun > kr 3507
9 Lian Xiao > cn 3505
10 Tuo Jiaxi > cn 3502
11 Kim Jiseok > kr 3502
12 Gu Zihao > cn 3488
13 Chen Yaoye > cn 3482
14 Zhou Ruiyang > cn 3477
15 Wang Xi > cn 3468
16 Kang Dongyun > kr 3467
17 Tang Weixing > cn 3458
18 Li Qincheng > cn 3457
19 Jiang Weijie > cn 3455
20 Huang Yunsong > cn 3454
21 Shin Jinseo > kr 3448
22 Gu Li > cn 3445
23 Peng Liyao > cn 3444
24 Hong Seongji > kr 3439
25 Lee Donghoon > kr 3437
Как вы считаете, победит ли AlphaGo текущего чемпиона Кэ Цзе?

Проголосовало 636 человек. Воздержалось 79 человек.

Только зарегистрированные пользователи могут участвовать в опросе. Войдите, пожалуйста.

Поделиться с друзьями
-->

Комментарии (46)


  1. Fen1kz
    06.06.2016 16:48
    +11

    Посмотрим, опровергнет ли AlphaGo расхожую фразу «Что бы ты не делал, всегда найдется азиат, который сделает это лучше»


    1. eugenius_nsk
      06.06.2016 21:27
      +1

      Интересно, участвовали ли азиаты в создании AlphaGo? Если да, то не опровергнет, а подтвердит.


      1. nonrblGyN4ik
        07.06.2016 11:02
        +1

        Достаточно чтобы нейросеть AlphaGo обучалась азиатами… Мыслить как азиат и всё такое:)


        1. Mad__Max
          07.06.2016 15:52
          +1

          Смотря что значит под "обучалась". Для обучения использовались записи игр сильнейших игроков планеты. А поскольку практически все сильнейшие игроки в ГО — азиаты, то получается AlphaGo училась "играть как азиат", перенимая их стиль/стратегии/фирменные ходы и т.д. независимо от того, кто ее изначально программировал.


  1. nikitastaf1996
    06.06.2016 16:53
    +3

    До октября еще есть время.Можно потренироваться :)


    1. yea
      06.06.2016 17:11
      +9

      До октября еще есть время

      Это-то и пугает. На играх с Седолем все увидели, что AlphaGo развивается сумасшедшими темпами — результаты, которые она показывала осенью прошлого года, были на порядок хуже, чем новые. Так что вполне вероятно, что к осени AlphaGo будет уже недостижима для мясных человеков — если продолжит прокачиваться теми же темпами, конечно.


      1. solariserj
        07.06.2016 11:12
        +1

        Ну как бы до Ли Седоля из профессиональных игроков никто не верил в AlphaGo серьезно, и вот Седоль пришел на расслабоне и увидел как у него утянули победу за победой, потом напрягся, но так и не смог вытянуть. К этой игре будут уже готовится основательней(правда не знаю как идет подготовка), но то что подойдут к игре серьезно это, да.
        Но если честно осталось 2-3 года и AlphaGo будет уверенно выигрывать у любого человека, и через 5-7 лет даже на 9 камнях форы.


  1. igruh
    06.06.2016 17:21
    +1

    Представляется немного странным, что после одной серии игр с одним человеком рейтинг системы стал столь высоким. Обычно рейтинги учитывают результаты за довольно большой период времени.


    1. AlAnSa
      06.06.2016 19:18

      А где сказано, что AlphaGo получила рейтинг только за одну серию игр? Судя по тексту — как раз наоборот:

      сразу после игры с Седолем AlphaGo набрала 3533 очков, что позволило системе занять четвертое место в общемировом рейтинге игроков го. С тех пор компьютерная система поднялась еще выше, заняв второе место.


      1. igruh
        06.06.2016 22:05
        +1

        сразу после


        1. AlAnSa
          06.06.2016 22:17
          +1

          И что? А с чего вы решили, что ее рейтинг начал считаться сразу перед игрой? На каком она УЖЕ была месте? Так то она и до Седоля играла.


        1. Mad__Max
          06.06.2016 22:35
          +1

          Это была не 1я ее официальная игра. Она с осени прошлого года несколько раз с живыми соперниками играла, еще до серии игр с Седолем. В т.ч. "в сухую" обыграла чемпиона Европы по го: https://geektimes.ru/post/269990/


  1. nkie
    06.06.2016 17:41
    +1

    Учитывая что сеть специально будут натаскивать на играх Кэ Цзе, ему для победы нужно будет полностью изменить свою привычную стратегию. В этом случае у него будет возможность победить.


    1. dom1n1k
      06.06.2016 21:08
      +1

      Вот в этом и несправедливость. Машину можно сутками натаскивать на борьбу с конкретным человеком, который не может быстро измениться. А в алгоритмах постоянно тюнят какие-то параметры, от которых поведение может серьезно меняться, поэтому изучать прежние партии AlphaGo может быть неэффективно.


    1. Lure
      06.06.2016 21:33
      +1

      Не факт, это же игра с полной информацией. Вдруг у него и так стратегия близка к оптимальной. А программа сможет найти какие-то слабые места, и тогда он ещё и усилит собственный уровень по результатам проигрышей. А лезть в какое-то болото незнакомых ему самому вариантов не особо полезно, выше шанс, что он там накосячит.

      Вот в игре с неполной информацией другое дело. Если программа натаскана на игрока в покер по его раздачам с открытыми картами, то правильно будет сменить многое. Например — если блефуешь очень часто на досках определённого вида — надо перестать это делать. Любое своё привычное отклонение от GTO надо обратить — поначалу будет плюс, пока программа не подстроится. Далее, если ты очень силён — стараться играть GTO. В теории, это даст небольшой, но перевес над «заточенной» программой.


      1. naneri
        07.06.2016 23:08

        В этом плане будет интересно посмотреть когда гугл возьмётся за ИИ играющий в старкрафт.


    1. Sychuan
      07.06.2016 00:25
      +1

      Вроде как всегда говорили, что ее не учат на специальных играх. Т.е. АльфаГо сыграла миллионы или миллиарды игр, на играх какого-то конкретного человека она ни чему не научится


    1. roboq6
      08.06.2016 11:11

      Так в том-то и дело, что сеть ни на кого не натаскивают. В интервью создатели AlphaGo прямо говорили что AlphaGo никто не тренировал конкретно против Ли Седоля.


  1. alcheorg
    06.06.2016 17:43
    +1

    Известно по каким правилам пройдет эта игра?


  1. Tanyku
    06.06.2016 18:02
    -1

    Кто-нибудь использовал нейросеть, чтобы обрабатывать теоремы и гипотезы (доказывая или опровергая их) или этого они ещё не умеют?
    Или игра в го способствует этому?


    1. Bytamine
      06.06.2016 18:49
      +3

      Сейчас игра в го способствует только игре в го.


      1. Tanyku
        07.06.2016 09:53
        +1

        Тогда почему не дать нейросети обрабатывать теоремы? Дать ей данные по физики/химии, например.
        Сначала учить её доказывать уже доказанное человеком, потом дать анализировать и вычислять то, что нам неизвестно.


        1. nikitastaf1996
          07.06.2016 10:05
          +1

          https://habrahabr.ru/post/183374/


          1. Tanyku
            07.06.2016 10:35
            +1

            поясните


            1. lo0p3r
              07.06.2016 11:04
              +1

              Вдогонку — geektimes.ru/post/276468
              Мало получить само доказательство. Его нужно понять и проверить. А сделать это, скорее всего, весьма затруднительно.


              1. Tanyku
                07.06.2016 11:20
                +1

                Интеллект — это инструмент, который даёт способности познавать, обучаться, мыслить логически, систематизировать информацию путём её анализа, определять её применимость (классифицировать), находить в ней связи, закономерности и отличия, ассоциировать её с подобной и т. д

                Искусственный интеллект — это наш помощник, который должен помогать в получении знаний, проверках, анализе, выводах и тд.
                С помощью него мы и должны выходить из таких тупиков, как в статьях.

                Если наш интеллект способен самостоятельно справляться с этим, то зачем нам ИИ?


                1. Bytamine
                  07.06.2016 12:52
                  +1

                  В словосочетании «искусственный интеллект» в настоящий момент правдиво только первое слово. Интеллектом ИИ не является. Но если рассматривать его, как черный ящик, то для внешнего наблюдателя в некоторых условиях может казаться, что таки да.


                  1. Tanyku
                    07.06.2016 14:08
                    +1

                    Ясно и обидно. А я-то размечталась =(


  1. bazilxp
    06.06.2016 19:39

    В Статье опечатка в опросе «Как вы считаете, победит ли AkphaGo текущего чемпиона Кэ Цзе?»

    И ссылки на партии Ли Седоля SGF файлы


  1. Necrozyablo
    06.06.2016 19:54
    +1

    Однако, есть проблема. Кэ Цзе в последнее время не в лучшей форме.


    1. bazilxp
      06.06.2016 19:59

      Ли Седоль выиграл одну только партию из 5… В одной шансы были хорошие компьютер нашел мерзкий ход… Тут дело не в форме, этот кластер имеет очень сильный уровень игры=) з.ы. я сопереживал за Ли Седоля…


      1. Necrozyablo
        06.06.2016 21:09
        +1

        Ну просто тот же Ли заявляет, что выиграет у «Го Бога» на 2 камнях форы. Т.е. по его мнению предел мастерства близок.
        А Кэ Цзе впоследнее время слил несколько важных партий. И не факт что он прямо сейчас топ1.
        Я был бы рад увидить игру сразу с несколькими про. Потому как далеко не факт что Ли был в лучшей форме.
        К слову фусеки, которые применял АльфаГо уже несколько раз играли в про играх. И во всех они не сработали.


        1. bazilxp
          06.06.2016 21:25

          я бы тоже рад был увидеть игру например против Такемии Масаки=)

          Строитель больших Мое=)


  1. Ablomov
    06.06.2016 21:33
    -1

    Надо стравить машину (ИИ) с машиной (ИИ)!!!


    1. Prototik
      06.06.2016 22:22
      +3

      AlphaGO так и обучался, по сути. Много-много тысяч итераций.


  1. themtrx
    06.06.2016 22:46
    +2

    Буду болеть за Скайнет.
    Интересно, где-то есть тотализатор? Поставил бы биткоин-другой на своего фаворита.


  1. RomanVZ
    06.06.2016 23:05
    +1

    Игра Го придумана мудро: если один противник сильнее другого, более слабому дается фора до 9 камней. Причем есть варианты правил, когда эти камни можно ставить не только в «стандартные» позиции на доске. Так что о том, что компьютер полностью обыграет человека, можно будет говорить лишь тогда, когда у человека будет фора в максимальные 9 камней.


  1. assign
    06.06.2016 23:33
    +1

    Игра на новом уровне — найди ошибки в алгоритме тактики программы.


    1. solariserj
      07.06.2016 00:08
      +1

      И со временем она их учтет


  1. lain8dono
    07.06.2016 11:02
    +2

    Я предлагаю в табличке для пола AlphaGo использовать символ Нептуна ?.


  1. WinDigo
    07.06.2016 11:38
    +1

    К сожалению, судя по всему, пока что это всего лишь слухи. В самом источнике из статьи используются фразы «Очень вероятно, что...» и «Ке Цзе надеется сыграть в октябре...». Более того, там же говорится, что «Демис Хассабис проявил желание пригласить Ке сыграть с АльфаГо, но пока что от него нет никаких признаков возможности этого матча в октябре». Т.к. Демис в данном случае является представителем АльфаГо, это важный нюанс.
    Наиболее серьёзным аргументом того, что это слух, является твит самого Хассабиса: twitter.com/demishassabis/status/739832323160563712. В нём говорится о том, что «Вопреки слухам в интернете мы пока ещё не решили, что делать дальше с АльфаГо. Как только определимся, здесь появится официальное объявление».


  1. Animan
    07.06.2016 14:27
    +1

    Как однажды резонно замечали — ограничивать надо не время на ход, а энергозатраты на ход. Мозг тратит сильно меньше чем кластер вычислительный. Будет честнее.


    1. Fen1kz
      07.06.2016 14:36

      AlphaGo нужен не для выигрыша в Го, а для развития ИИ, а стало быть нужно выжимать из него максимальные мощности, не беспокоясь о размерах/энергозатратах, ибо по мощности ИИ пока отстает


      1. Animan
        07.06.2016 15:57
        +1

        Но данный ИИ будет только уметь играть в Го. Метод вполне показал эффективность такого обучения и подхода. К чему тогда эти показательные матчи вообще?)


        1. JediPhilosopher
          07.06.2016 19:39
          +2

          Очевидно чтобы привлечь внимание общественности. А где внимание — там деньги, реклама и новые люди, готовые этим заниматься.

          Это как с космосом. С практической точки зрения важен не флаг, воткнутый на Луне, а куча всяких технологий открытых в процессе. Но вот открыть их могли только при наличии денег и людей. Которых привлекла амбициозная цель по втыканию флага, а не изобретение какого-нибудь жаропрочного покрытия, нужного и поленого но скучного.


  1. Zhrun
    07.06.2016 17:39
    +1

    Зачем в последней таблице третий столбец? Только для того, что бы показать, что АльфаГо не мужчина?