Совсем недавно на Geektimes публиковалась информация о том, что AlphaGo, компьютерная система, разработанная компанией DeepMind, победила чемпиона мира по го Кэ Цзе в первом из трех матчей в рамках праздника го. Перевес компьютера по очкам был совсем небольшим, но некоторые эксперты посчитали, что разработчики Deep Mind просто не захотели, чтобы система разгромила мастера, для добавления зрелищности этому матчу.

Некоторые профессиональные игроки в го с высоким даном, следившие за ходом матча, заявили впоследствии, что человек вряд ли способен выиграть у компьютера. Возможно, подтверждением этих слов можно назвать результаты второго матча, в котором снова победил компьютер, ранее побивший Ли Седоля.

Комментаторы отмечают, что в новом матче Кэ играл практически идеально в течение первых 50 ходов. Он использовал достаточно сложную стратегию, развивая различные сценарии на доске. Но AlphaGo «заметила» угрозу и смогла справиться с атакой на всех фронтах. Впоследствии система вынудила чемпиона сдаться. «Первые 100 ходов мы видели, пожалуй, лучшую игру из всех, что когда-либо проводились с Master-версией AlphaGo», — заявил глава DeepMind Демис Хассабис.

Сам Кэ сказал после мачта, что новая игра отличалась от предыдущей. Дело в том, что AlphaGo делала ходы, которые выходили за рамки выигрышной стратегии, которую на месте системы мог бы использовать сам Кэ.«Я думал, что я был близок к победе в середине игры, но AlphaGo думала по другому. Мне немного грустно и я сожалею, поскольку я думал, что играл очень хорошо», — заявил чемпион.


Напомню, что Цзе заявил о своем отказе играть с компьютером после завершения серии матчей с AlphaGo.
Поделиться с друзьями
-->

Комментарии (56)


  1. Shaco
    25.05.2017 17:32
    -5

    Интересно, это только я упустил момент, когда в новости описываемая партия сменилась с первой на вторую?


    1. Shaco
      25.05.2017 20:13
      -2

      Я, конечно, понимаю, что редакторы на ГТ занятые люди, и написать в комментарии «поправил» слишком трудоёмко, но слов «в новом матче» в третьем абзаце не было в исходном тексте.


      1. AllexIn
        25.05.2017 23:24
        +3

        А что помешало вам отправить комментарий в личку для исправлений? Собственно поэтому всегда и говорят — исправления отправляйте в личку. Текст исправят, а ваш коммент останется висеть.


  1. zuborg
    25.05.2017 17:41
    +1

    Интересно, насколько вырастет уровень игры топовых игроков, когда они потренируются в несколько сотен игр с АльфаГо. Среди профи бытует мнение, что уровень игры чемпионов Го принципиально не меняется уже тысячи лет.


    1. ertaquo
      25.05.2017 17:45
      +2

      Заметьте, от этого будет расти уровень не только игроков, но и AlphaGo.


      1. zuborg
        25.05.2017 18:02
        +1

        Ну и пусть, так ещё интереснее )


      1. roboq6
        25.05.2017 18:16
        +1

        Тогда возможно стоило бы временно отключить функцию самообучения, позволив профессионалам набраться опыта и нащупать слабые места AlphaGo. Думаю Google это было бы интересно.


        1. webmasterx
          26.05.2017 14:50

          И чем же? Мне кажется гораздо интереснее найти те места, где AlphaGo упрямо не учится.


          1. roboq6
            26.05.2017 16:17

            места, где AlphaGo упрямо не учится


            Я сомневаюсь что такие места вообще есть.

            И чем же?


            Во-первых, это позволит понять насколько сильней стал AlphaGo. А для этого нужно его несколько раз победить, нащупать слабые места. Фигурально выражаясь, чтобы понять насколько высока стена нужно через неё перелезть. Что довольно проблематично если сама стена находится в постоянном процессе быстрого роста. Возможно уже через месяц заморозки, постоянных интенсивных игр с профи и тщательного исследования сыгранных партий будут найдены слабые места которые позволят сокрушать AlphaGo во время каждой партии как гнилой орех. Возможно слабые места будут найдены лишь через год, и то они будут давать лишь призрачный шанс на победу. А возможно победы над ним не будет и через 10 лет, но зато сообщество Го получат НЕисчерпаемый источник высокоэффективных и креативных стратегий/приёмов игры (в этом случае AlphaGo уже фактически достиг уровня всезнающего непобедимого гуру Го. По крайней мере с человеческой точки зрения).

            Во-вторых, было бы интересно устроить эдакую «гонку вооружений» между элитой Го и AlphaGo. Сначала происходит заморозка и профи ищут слабые места AlphaGo, попутно повышая своё мастерство и обогощая познания человечества в области Го (кстати, интересная мысль — создать искусственного эксперта чтобы потом пытаться перенять его опыт). После нескольких побед над AlphaGo происходит разморозка, он учится на своих ошибка и перестаёт проигрывать. Потом снова заморозка и снова поиск слабостей. Тут можно будет увидеть насколько быстро и гибко будут адаптироваться как AlphaGo так и люди играющие против него. Будет ли людям с каждым разом всё трудней и трудней «подобрать ключик»? Достигнет ли AlphaGo такого состояния когда люди будут неспособны его побеждать даже в состоянии заморозки?


      1. slonofanya
        25.05.2017 22:28
        +1

        Думаю дальше уже интереснее наблюдать за игры между ИИ. Скорее всего для этого учредят отдельную лигу. А потом подключат их к мозгу и станет еще интереснее, надеюсь )


        1. Camrad_RIP
          27.05.2017 05:51

          Нормальному человеку (тм) наблюдать за такой игрой все равно что смотреть как математики теорию относительности обсуждают.


    1. Necrozyablo
      25.05.2017 18:10
      +7

      Есть другое мнение.
      По Го


      1. Nomad1
        25.05.2017 18:56
        +2

        Грустное какое видео: целые жизни проходят перед глазами, они многие начинают очень молодыми, доходят до топов к 20 годам и потом медленно уходят из рейтинга.


      1. roboq6
        25.05.2017 19:05
        +1

        и там тоже видно что уровень растёт.


        «После» НЕ значит «Вследствии». Как можно заметить средний уровень топовых игроков растёт со временем, поэтому данный рост вполне может быть следствием обычного хода вещей, без особого влияния компьютерных программ на игру элитных игроков.


      1. roboq6
        25.05.2017 19:11
        +3

        P.S. Посмотрел в Википедии, там пишут что шахматный рейтинг возможно постоянно увеличивается потому что в нём есть какой-то косяк который приводит к инфляции рейтинга, делая НЕвозможным корректно сравнить игроков из разных эпох.

        Цитирую,

        Many people believe that this rise is mostly due to a system artifact known as ratings inflation, making it impractical to compare players of different eras


        Ссылка на подробности:

        http://en.chessbase.com/post/rating-inflation-its-causes-and-poible-cures


        1. roboq6
          25.05.2017 20:01
          +4

          Для тех кому лень читать всю статью, привожу гипотезу автора насчёт причин инфляции (как я её понял):

          Предположим у нас есть игроки чей истинный ранг равен 2000. Но иногда кто-то из них может оказаться на пике своих возможностей и у него произойдёт временный скачок в ранге, оказываясь выше 2200. Ранг 2200+ уже приводит к включению их в рейтинг и как следствие игроки которые победили таких «выскочек» получают такие же очки как игроки которые победили игроков чей истинный ранг действительно 2200. В свою очередь эти избыточные очки передаются от игроков которые победители «выскочек» к игрокам которые победили уже их самих. И так далее, эти очки путешествуют в топ по принципу «пищевой цепочки». А уж назад из топа лишним очкам ходу нет, они лишь будут циркулировать взад-вперёд между элитными шахматистами.


          1. lega
            26.05.2017 00:37
            +1

            В кратце, максимальный рейтинг растет из-за роста кол-ва участников.


            1. roboq6
              26.05.2017 01:21
              +1

              В статье это мнение как раз опровергалось (насколько убедительно — уже другой вопрос. Боюсь мои познания в статистике недостаточны чтобы об этом судить)


        1. upsilon
          26.05.2017 11:22
          +1

          Уровень игроков в шахматы вырос за столетия, это видно если просто взглянуть на партии (говорю как шахматист), или, как уже сказали выше, дать партии компьютеру на анализ.

          Уверен в го ситуация аналогичная, только если не было стагнации по какой-то внешней причине (на-пример, если бы игру объявили вне закона).


  1. Marwin
    25.05.2017 18:09
    +2

    заранее извиняюсь, если скажу чушь применительно к стратегии игры в го, но что может противопоставить человек системе, у которой «перед глазами» тысячи и тысячи исходов партий с различными комбинациями зон влияния, которые в конечном итоге привели когда-то к выигрышу. И наверняка играющие ранее в те партии игроки даже могли не знать приведет ли их очередное решение к выигрышу или нет, поэтому и для текущей партии ход компа может показаться противнику нерациональным, однако комп-то знает, что в итоге это обернется ему благом.
    Пусть это и не 100% математически верный расчет идеального хода как в шашках, но мысль остается сходной… у компа всё равно огромное преимущество по памяти предыдущих игр. Алгоритм, обучающий выбирать оптимальные шаги на их освное — пусть и сложное, но дело техники. Не сегодня так завтра…


    1. RuddyRudeman
      25.05.2017 18:30
      +7

      Если бы преимущество определялось в основном количеством игр в памяти, то человек перестал бы побеждать у компьютера лет 30 назад. Однако в го за всю историю не было ни одной одинаковой партии (вероятно), а удачный ход при одном раскладе может оказаться причиной поражения при другом. Следовательно оценивать потенциальный ход нужно стратегически, продумывая очень абстрактные образы того, как он может повлиять сейчас или через 10 ходов с учетом положений остальных камней (или фигур). Вот в этом то люди и сильны, но до последнего не могли уловить, как этот навык оцифровать. И оказалось, что успешный формат оцифровки вовсе не в запоминании, а в нахождении взаимосвязей и паттернов.


    1. ivlis
      26.05.2017 00:16
      +1

      В этом и фишка Го, что её перебором вариантов не выиграть.


      1. Bytamine
        26.05.2017 13:18
        -2

        Это пока.
        Закон Мура на стороне роботов.


        1. Aksiom
          26.05.2017 13:50
          +2

          Закон Мура уже замедляется — надежда на альтернативные материалы.
          В любом случае — полный перебор состояний го невозможен — количество возможных комбинаций намного больше, чем число атомов в наблюдаемой Вселенной. Хотя сейчас нет даже уверенности насчёт возможности полного перебора колоды из 52 игральных карт.


          1. roboq6
            26.05.2017 16:22
            -1

            полный перебор состояний го невозможен


            Мне кажется квантовые компьютеры дают надежду на полный перебор, не так ли?


            1. Aksiom
              26.05.2017 18:04

              К сожалению, на этот вопрос у меня нет ответа, возможно, это так.
              Тоже было бы интересно узнать!


            1. br0x
              31.05.2017 12:56

              Квантовые компьютеры если и помогут чем-то, то скоростью оценки конкретной позиции. А поскольку оцененные состояния надо где-то хранить, то все упрется в емкость памяти. Как было сказано выше, полный перебор Го выходит за все возможные в этой Вселенной рамки


          1. roboq6
            03.06.2017 09:48

            В любом случае — полный перебор состояний го невозможен

            Для стандартной доски 19х19 — да.

            Но вот для маленьких досок решение можно найти. Более того, го для доски 5х5 УЖЕ решён (http://erikvanderwerf.tengen.nl/5x5/5x5solved.html).


            1. Aksiom
              03.06.2017 14:29

              Да, я имел в виду 19x19.
              Интересно будет посмотреть, как будет развиваться ситуация с 9x9.


    1. daiver19
      26.05.2017 02:39
      +2

      Именно это собственно и делает AlphaGo, прорыв заключается в том, что, во-первых, раньше это никто толком не мог реализовать и, во-вторых, вместо какой-то базы данных с позициями она оперирует сверточными НС (aka «система распознавания образов»).


  1. solariserj
    25.05.2017 18:38
    +1

    Кто знает А почему не играет 5 партий как с ЛиСедолем, а только 3? Может за пять партий дал бы хоть одну победу.


    1. zone19
      25.05.2017 18:48
      +2

      Принципиально это ничего бы не поменяло.


    1. zookko
      25.05.2017 19:13
      +12

      Это триал-версия AlphaGo. Та, что без регистрации и смс.


  1. impetus
    25.05.2017 20:32
    -9

    Объективно это хорошо — цивилизация «востока» м.б. чуть меньше станет считать себя богоизбр исключительной — «запад» сумел опять своими дьявольскими машинами победить их на самом «их» исконном поле… (что б там ни говорили дипломаты — китайцы ( и японцы) всех прочих людьми не считают — это увы факт)


  1. Arxitektor
    25.05.2017 21:50
    -1

    Вот интересно а в покер машина на этой технологии играть сможет?
    И где больше вариантов и сложнее сама игра покер или ГО?


    1. BiTHacK
      25.05.2017 22:07
      +2

      Покер и го слишком сильно различаются, чтобы их сравнивать. В покере есть неслабая часть психологии, которой лишена го. Да и стратегии в покере как таковой нет, просто вероятности.


      1. slonofanya
        25.05.2017 22:42
        +1

        Можно будет развивать и эту часть функционала, главное что бы у инвесторов интерес не пропал )


      1. sumanai
        25.05.2017 23:07
        +7

        В покере есть неслабая часть психологии, которой лишена го.

        И у компьютера тут преимущество в виде непрошибаемого покерфейса.


    1. ramzai
      25.05.2017 23:08
      +3

      1. ainoneko
        26.05.2017 06:36
        +2

        И при этом компьютер ещё не использовал анализ выражения лиц.


        1. QDeathNick
          28.05.2017 01:16

          … и генерацию эмоций на своём лице.


  1. FirExpl
    26.05.2017 08:55
    +3

    Мне одному кажется нечестным ограничение по времени в партиях человека с машиной? У машины гораздо больше мощностей, чем у человека, и тем не менее их ставят в «одинаковые» условия, которые по факту являются форой для машины, так как в конечном счёте человек оказывается в состоянии цейнтнота, что хорошо иллюстрирует вот эта фраза:

    «Первые 100 ходов мы видели, пожалуй, лучшую игру из всех, что когда-либо проводились с Master-версией AlphaGo», — заявил глава DeepMind Демис Хассабис.


    1. Hellsy22
      26.05.2017 12:11
      +1

      У машины гораздо больше мощностей, чем у человека
      А как вы сравнивали?


      1. FirExpl
        26.05.2017 14:53

        1) Энергопотребление у АльфаГо я подозреваю сильно выше чем у мозга.
        2) Мощность — это количество работы за единицу времени. Предположим, что работа в данном контексте это поиск оптимального хода, и так же предположим, что пока человеку хватает времени, он делает примерно такие же по качеству ходы как и машина (а исходя из описаний партий такой вывод можно сделать). Как мы видим к ходу под номером N (например 100) у человека остаётся значительно меньше времени на ходы, и можно смело сделать вывод, что мощность мозга ниже. (по крайней мере в данной задаче)


        1. Hellsy22
          27.05.2017 02:50

          Энергопотребление выше — это факт. Но это, как бы, скорее говорит о несовершенстве компьютеров, чем об их превосходстве. И я не согласен со сравнением качества — исходя из описания партии можно сделать вывод, что AlphaGo доминирует буквально с самого начала.

          Пожалуй, я соглашусь, что ради спортивного интереса стоит ограничивать лишь время на ход, а в перспективе, когда AlphaGo продемонстрирует свое абсолютное превосходство даже в таких условиях — признать, что люди проиграли и начать думать в сторону урезания компьютеру времени или потребляемой энергии — не то, чтобы это поможет, скорее отодвинет проблему лет на 10, но может оказаться неплохой мотивацией к оптимизации.


    1. demimurych
      26.05.2017 16:50
      +2

      Даже сам факт того, что вы и многие другие, стали рассуждать с позиции — честно нечестно, говорит о невероятном прорыве подобных технологий.
      Я напомню, что Го была последней игрой где считалось, что современный компьютер не может выиграть у человека в принципе.


      1. xPomaHx
        27.05.2017 12:28

        Последней? Уверен что сейчас есть куча игр где комп слабее, не говоря о еще не придуманных играх.


        1. Fedorchik
          01.06.2017 08:52

          Слабее из-за того что эти игры как Неуловимый Джо. В случае с Го говорили именно о принципиальной невозможности победить человека.


        1. roboq6
          01.06.2017 11:48

          Кроме самой игры ещё важно сколько людей в неё играет.

          Есть игра Arimaa, которая была специально создана таким образом чтобы компьютеру было трудно победить в ней. Был даже Arimaa Challenge с призом в $10 000 за первую победу ИИ на человеком, однако уже в 2015-ом году ИИ победил людей (http://www.kingpinchess.net/2015/07/arimaa-game-over/). Вполне допускаю мысль что это игра которая для ИИ тяжелей чем Го, но дело в том что сама игра довольно малопопулярна. Соответственно меньше шанс на появление самородков вроде Ли Седоля.


  1. Kalashmatik
    26.05.2017 14:35

    Интересно, а если две AlphaGo посадить играть друг против друга, будет ли победа вообще и насколько будет эффективно обучение при таком раскладе?


    1. GlukKazan
      26.05.2017 14:48

      Го — это такая игра, в которой ничьи большая редкость. Так что одна из AlphaGo обязательно выиграет.
      А обучение у AlphaGo, по большей части, именно так и происходит.



  1. ideological
    27.05.2017 11:35

    А там реально какой-то алгоритм сложный или просто перебор всех возможных ходов?
    Например в шахматах обычно готовятся «правильные ответы» на популярные ходы дебютов, а потом уже работает «перебор».
    Если так, то называть это победой компьютера не совсем верно.
    Возможно нужно ограничивать время на ход у компьютера, иначе какой-то дисбаланс :).


    1. sumanai
      27.05.2017 12:31
      +1

      А там реально какой-то алгоритм сложный или просто перебор всех возможных ходов?

      Перебор там невозможен.
      Если так, то называть это победой компьютера не совсем верно.

      А чем это называть? Люди тоже запоминают дебюты, и тоже перебирают в голове варианты.


    1. KvanTTT
      27.05.2017 14:50

      Например в шахматах обычно готовятся «правильные ответы» на популярные ходы дебютов, а потом уже работает «перебор».

      Ну как бы метод Монте-Карло на дереьвях и повышает вероятность "правильных ответов" используя для этого перебор и информацию из нейросетей.


  1. lega
    27.05.2017 11:44
    +1

    Завершился 3-й матч в пользу AlphaGo

    #AlphaGo is just perfect. I could only guess half of the rationale for its moves.
    @ KeJie

    Помотреть несколько партий AlphaGo vs AlphaGo можно тут.