Прошлые три игры исторического матча выиграл ИИ



Огромный плюс победы человека: мы увидели, как в интерфейсе AlphaGo выглядит признание поражения.

Сегодня прошла четвёртая партия матча Ли Седоль — AlphaGo. Играют известный 33-летний обладатель девятого профессионального дана и система компьютерного го от подразделения DeepMind компании Google. Сегодня Седоль выиграл.

AlphaGo — продукт от DeepMind, который комбинирует метод Монте-Карло с нейросетями политики и ценности. Играющая в Сеуле система является результатом двух лет работы, в том числе машинного обучения нейросетей на 160 тысячах партий с сервера KGS и в играх против самой себя. В прошлом октябре AlphaGo уже выигрывала у сильного игрока. Это был трехкратный европейский чемпион Фань Хуэй, который проиграл искусственному интеллекту в пяти из пяти партий.

Считается, что в Европе уровень владения го ниже, чем на родине игры, в Азии. Показать явное превосходство должен матч против Ли Седоля. Профессионал уже проиграл в трёх играх из пяти. Теперь ясен и исход серии, и судьба призового миллиона долларов — он уйдёт на благотворительность и организациям по развитию го. В последних двух партиях определится глубина поражения команды людей.

Вчера, после третьего поражения человека, одной из тем пресс-конференции был вопрос, есть ли у AlphaGo слабые места. Седоль упомянул, как чувствовал, что они есть. Он извинился перед корейской нацией и сообществом игроков го за показанный результат.

Легко понять его напряжение. Го — популярная в Корее игра, по некоторым оценкам в неё играют около 8 миллионов человек. В Южной Корее новости о матче выходят на первые полосы газет. Серьёзность происходящего для Google показывают фигуры наблюдателей. Игры посещают бывший глава Google Эрик Шмидт, сооснователь поискового гиганта Сергей Брин и один из важных инженеров компании Джефф Дин. Последний помогал Google прокладывать оптический канал в отель Four Seasons, в котором проходит матч. Канал нужен для связи с дата-центрами компании, где на сотнях процессорных ядер и видеоускорителей запускается AlphaGo.



Человек играл белыми, то есть у ИИ было преимущество в виде хода первым. Как и в предыдущих играх, Седоль исчерпал время раньше оппонента. То есть в какой-то момент человек был вынужден тратить всего по минуте на ход. В свою очередь система AlphaGo хорошо распоряжалась временем — это результат добавления нейросети, которая помогает управлять им.

78 ход белых оказался отличным. Возможно, Седоль действительно нащупал слабое место компьютерной системы. AlphaGo ответила слабо. Как пишет глава DeepMind Демис Хассабис, на 79 ходу система допустила ошибку, но поняла это только на 87 ходу. После этого ИИ запутался.


AlphaGo начала делать откровенно слабые и ужасные ходы. Система признаёт поражение, когда оценка шанса победы падает ниже 20 процентов. Об этом инженер Google Дэвид Сильвер напомнил во время перерыва, который взял Ли Седоль. Сильвер отказался комментировать серию невнятных ходов системы. Игра продолжилась, и Седоль всё так же был вынужден работать в условиях недостатка времени. ИИ допустил ещё один промах, а чуть позже признал поражение. Результатом противостояния на 4,5 часа и 180 ходов стала победа человека. Седоль заявил, что его никогда не поздравляли так сильно за всего лишь один выигрыш.



Игр будет проведено пять, и счёт 3-1 уже поставил точку в вопросе о победителе. Но для оценки силы системы важен общий результат матча. Последняя, пятая партия пройдёт во вторник. Как и прошлые четыре, она будет транслироваться на канале DeepMind на YouTube. Интересно, что в октябре Фань Хуэй тоже выигрывал у AlphaGo. Европейский чемпион одержал победу два раза, но в неформальных играх.

Го — древняя восточноазиатская логическая игра. Каждому из двух игроков нужно отгородить камнями своего цвета территорию как можно большего размера. Исследователей искусственного интеллекта в го привлекает сложность: позиций слишком много, чтобы перебрать их. Компьютерные системы давно подчинили себе и шашки, и шахматы. К примеру, с 2005 года лучшие из людей проигрывают лучшим из компьютерных систем по игре в шахматы. Системы компьютерного го есть, но играют они на уровне любителей. До появления AlphaGo эксперты считали, что игра го останется неприступной ещё десяток лет.

Ходы четвёртой игры

Комментарии (132)


  1. isotoxin
    13.03.2016 13:23
    +12

    Психологический пресс снят — всё равно на круг уже проиграл. Играл на расслабоне. Вот и выиграл :)


    1. valemak
      13.03.2016 13:34
      +3

      Да, миллион долларов призовых уже был неактуален, осталось просто получать от игры удовольствие. Впрочем, Седоль так раскачивался над доской во время партии, что создавалось впечатление будто он проигрывает в разгромном стиле.


      1. kranky
        13.03.2016 19:54
        +12

        > создавалось впечатление будто он проигрывает в разгромном стиле.

        Блефовал, чтобы ИИ потерял бдительность. Сработало похоже.


    1. ghostinushanka
      14.03.2016 04:40
      +2

      Интересно на самом деле, ведь компьютер не подвержен «психологическому стрессу». Как по мне это один из важнейших факторов итогового счёта 3:0 по результатам предыдущих партий.
      Сколько раз уже бывало в любом из видов спорта что даже явный фаворит проигрывал, просто потому что «плющит».
      А сей раз Седоль просто играл себе в удовольствие и в центре «затащил на расслабоне».


    1. Vlad_Hm
      14.03.2016 09:09
      +3

      Самое страшное начнётся, когда АльфаГо начнёт играть на расслабоне. После того, как круг уже выиграла… и вправду, чего электроны туда-сюда впустую гонять, когда можно подумать о чём-то более интересном?
      Вот тогда противникам курить нервно за углом будет уже поздно.


  1. idziev
    13.03.2016 13:26
    +15

    Всё-таки молодец мистер Ли, после трёх поражений он был разбит и подавлен. А сегодня прям сиял. Не стоило недооценивать противника. Возможно, не проиграй он первую игру, результат серии был бы другим.


  1. valemak
    13.03.2016 13:26

    Честь Ли Седоля спасена. Послематчевого харакири не будет.

    Впервые наблюдал за партией от начала и до конца. Седоль сегодня активно угрожал во всех углах доски (в троих из них отвоевал заметную территорию), возможно, нейросеть ниасилила агрессивную игру сразу на 4 фронтах.


    1. Halt
      13.03.2016 18:13
      +3

      Седоль выиграл благодаря блестящей комбинации в центре доски, когда смог вторгнуться и удержать группу внутри мойо противника. До этого момента можно было сказать, что Ли капитально проигрывал. Ну а потом программа начала гнать откровенную лажу.


      1. ankh1989
        14.03.2016 07:40
        +2

        Там, судя по всему, проявило себя отсутствие решалки тсумего, что довольно странно, потому что в предыдущей игре Ли замутил очень заковыристую тсумегу в углу зависящую от хитрой последовательности ко, но АльфаГо даже не напрягся.


  1. nikolaynag
    13.03.2016 13:35
    +10

    Интересно, насколько тут важен фактор адаптации человека к игре с конкретной компьютерной системой? Он ведь натренирован играть с другими людьми. Может преимущество человека как раз заключается в том, что он может уже на трёх партиях чему-то новому научиться, а AlphaGo для этого нужно тысячи партий?


    1. lexore
      13.03.2016 16:35
      +1

      Мне кажется, фактор адаптации очень важен. AlphaGo проанализировала тысячи игр людей. Не думаю, что Ли Седоль имел возможность проанализировать массу игр этой системы. Это подтвердится, если он найдет слабину и сможет ей постоянно пользоваться.


      1. Halt
        13.03.2016 18:16
        +1

        Адаптация под людей — это только первый этап обучения системы. Как говорят сами разработчики, основную работу она провела, играя сама с собой.

        Насколько я понял, в будущем планируется организовать обучение вообще без человеческих партий. Тогда воможно мы увидем что-то новое. Хотя и в прошедших партиях, программа демонстрировала творческое мышление и делала оригинальные ходы.


        1. lexore
          13.03.2016 18:18
          +3

          Я имел в виду, а адаптировался ли Ли Седоль на работу программой?) Поиск и знание слабостей в стратегии соперника — важная составляющая в поединке.


        1. Hellsy22
          14.03.2016 08:43
          +2

          основную работу она провела, играя сама с собой.

          И это минус. При такой игре некоторые ошибки лишь накапливаются.


  1. ivansychev
    13.03.2016 13:46
    +9

    Я верил! Я верил в него!

    Ждём пятую партию. Будет очень интересно, если Седоль повторит успех четвёртой.


  1. Jamdaze
    13.03.2016 13:50

    Не слишком рано называть этот матч историческим?


    1. atomlib
      13.03.2016 13:53
      +14

      Вряд ли рано. Многие издания сравнивают этот матч с матчем между Deep Blue и Каспаровым. Были разве другие случаи такого масштаба, когда чемпиона го три раза подряд обыгрывала компьютерная система?


      1. stranger777
        15.03.2016 15:13
        +2

        Седоль не чемпион, увы и ах, хотя сильный профессионал. Пятый в Корейском рейтинге:
        http://english.baduk.or.kr/sub03_02.htm?menu=f13&divL=2


    1. valemak
      13.03.2016 13:59
      +2

      Нет. Ещё за день до матча большинство было уверено что ИИ не ровня человеку в го, и, может быть. через пару-тройку лет, когда разработчики проанализируют ожидаемое поражение AlphaGo в матче и улучшат игру, компьютерная система сможет показывать что-то интересное.

      Матч показал что всё, в плане го ИИ как минимум играет на уровне профи экстра-класса. И уже мало у кого сомнений, что в ближайшем будущем люди не будут иметь шансов против суперкомпьютера и в этой игре.

      Шахматы пали лет 10 назад, фактически теперь настал черёд го, считающейся гораздо более сложной в плане программирования стратегии.


      1. Halt
        13.03.2016 18:18
        +3

        Я бы еще добавил, что этот матч — фактически первая игра программы с серьезным соперником (и уже такой результат!). Можно только догадываться, что будет в будущем.


      1. prospero78su
        14.03.2016 11:00
        +1

        > Нет. Ещё за день до матча большинство было уверено что ИИ не ровня человеку в го, и, может быть. через пару-тройку лет,…
        )) Обожаю такие повороты.
        Между прочим, это отличная ситуация того, как люди могут прогнозировать последствия своих действий.
        И как люди оценивают потенциал подобных систем.


        1. valemak
          14.03.2016 12:11

          Тут ещё психологический момент. Оптимистично оценивать возможности ИИ = признавать, что люди теряют свои позиции и недалеко то время, когда киберсущества будут нас превосходить во всём. Осознание что мы "устареваем" неприятно, и людишки склонны думать что у них ещё есть порох в пороховницах.


          1. prospero78su
            15.03.2016 09:08

            Не знаю. Лично я не вижу в этом проблему.
            Сделай мне операцию, тыжеврач! (терапевт)
            Сделай компьютер, тыжекомпьютерщик (программист, сгорел монитор)
            Построй дом, тыжстроитель (инженер по расчёту домовых сетей)
            И в таком духе. Люди привыкнут. В-целом, хорошо, что люди боятся — будут идти осторожно. Хотя, на самом деле большинству пофигу — ведроид это один сплошной зонд. Кого это заботит по настоящему? )))


    1. Welran
      14.03.2016 06:38
      +2

      Как раз самое время. Это первый и неожиданный матч в котором была серьёзная борьба. Дальше пойдёт рутина когда люди будут все чаще проигрывать и в конце концов просто не останется шансов на победу.


  1. Barafu
    13.03.2016 13:54
    -2

    Сейчас пойдут слухи, что у AlphaGo «скрутили» умение, чтобы уж совсем не позорить игрока.


    1. valemak
      13.03.2016 14:25
      +6

      Такие слухи будут циркулировать в любом случае. Впрочем Google подозревать в переживаниях за репутацию Седоля оснований нет. Счёт 5-0 был бы наиболее предпочтителен для корпорации добра (в плане демонстрации прорывного успеха в области разработки ИИ).

      Хассабис после игры слегка нервничал — несколько минут мял какую-то бумажечку-шпаргалку, то сворачивал то разворачивал её. Всё-таки разочарован тем, что его детище не выиграло матч всухую.


      1. artemerschow
        13.03.2016 15:38
        +1

        Сомневаюсь, что для них 5-0 было бы предпочтительнее. Им самим было важно нащупать слабые места ИИ и это случилось.


        1. valemak
          13.03.2016 15:52
          +5

          Слабые места можно нащупать и без поражений. Матч с Фань Хуэем выявил существенные ошибки программы и для создателей AlphaGo счёт при этом был очень приятен :)


  1. agzamovr
    13.03.2016 13:55
    +3

    Необходимо упомянуть также то, что Седоль указал на слабость AlphaGo при игре черными. На пресс конференции он попросил у Демиса Хассабиса в последней игре опять играть белыми, на что Хассабис дал согласие. Если Седоль действительно нащупал слабую сторону программы, то в последней игре у Ли есть хорошие шансы на выигрыш.


    1. valemak
      13.03.2016 14:06
      +2

      Всё может быть. У белых изначально компенсация в 7,5 очков, чёрным приходится прилагать усилия по нивелированию этого разрыва. Возможно, в алгоритмах компьютерной системы существуют изъяны и величина китайского коми не уравновешивается правом первого хода.


      1. flashtech
        13.03.2016 14:38
        +23

        Если судить по словам разработчиков, то первая ошибка (на 79 ходу) — это ошибка именно value network. AlphaGo некорректно оценивала свою позицию, как выигрышную, вплоть до 87 хода.

        А вот дальнейшие «ошибки» это уже видимо следствие алгоритма MCTS и методики обучения. AG проигрывала небольшое количество очков (по оценкам комментатаров в пределах коми) и на столе были возможности отыграть там пару, там пару и может быть в отдаленной концовке удалось бы уравнять, особенно если навязать сложный ко-файт.
        Но сети AlphaGo были обучены только на бинарную оценку (победа/поражение), потому уменьшение отставания для нее не было приоритетом (грубо говоря, она не видала разницы между поражением в 20 и в 1 очко). Потому при анализе дерева отдавалось предпочтение ветвям, которые в пределах просчета давали видимые шансы именно на победу.
        Для наступления такой победы требовались маловероятные (крайне ошибочные) ответные ходы от Ли Седоля, но алгоритм из-за своей архитектуры отдавал предпочтение таким ветвям перед более безопасными, но не дающими очевидных шансов.
        Вот и получился тот набор ошибок AI в конце, когда тот играл «детские» ходы (а по сути в надежде на детскую ошибку оппонента), которые Ли Седоль тут же наказывал.


        1. KvanTTT
          15.03.2016 15:08
          +2

          В твиттере про 78 ход пишут: "Taken a quick look at the logs: AlphaGo gave a probability of <1 in 10000 for Lee's brilliant move 78, so AG found this move very surprising".


    1. tasman
      13.03.2016 15:04
      +3

      Если переводчик не напутала, то Ли "просил" сыграть чёрными и это была шутка https://youtu.be/yCALyQRN3hw?t=22455


      1. lksdfj89
        13.03.2016 15:07
        +1

        Разве это была шутка? Ребята из гугла, вроде бы, согласились.


        1. tasman
          13.03.2016 15:09
          +9

          Он в любом случае должен после белых играть чёрными. Он "попросил" играть чёрными, "так как белыми он уже выиграл". Ребята из гугла "согласились".


          1. l27_0_0_1
            13.03.2016 17:03

            В последней игре кто будет играть черными должно было решаться броском монеты.


            1. tasman
              13.03.2016 17:24
              +1

              А где можно глянуть правила на этот счёт? Быстрый гугл не помог.


              1. l27_0_0_1
                13.03.2016 17:42
                +1

                Это правила самой игры. Правда, я немного наврал, что броском, но вероятность выбора должна быть как у броска монеты.


                1. tasman
                  13.03.2016 17:51
                  +3

                  Перечитал дважды, поправьте если я не правильно понял.
                  Нигири применяется:
                  1 В начале серии партий, для определения цвета (Ли и АльфаГо тоже разыгрывали нигири в первую игру), потом цвет чередуется.
                  2 После достижения счёта 3:3 в чемпионате, игроки снова разыгрвают нигири (я так подозреваю, что для 5 игр было бы 2:2)

                  Не нашёл по вашей ссылке правила, что бы в последней игре серии разыгрывали нигири в любом случае, пишут про ничью по очкам перед последней игрой.


                  1. l27_0_0_1
                    13.03.2016 18:38
                    +1

                    Я так понимаю, что 3:3 (в нашем случае это 2:2, соответственно) относится к количеству сыграных партий за каждый из цветов, чтобы поставить игроков в одинаковое положение, в последней игре снова разыгрывается нигири.


                    1. tasman
                      13.03.2016 18:47
                      +1

                      After reaching a 3-3 tie in a championship series[...]
                      tie довольно однозначно переводится как ничья, равный счёт. (https://slovari.yandex.ru/tie/%D0%BF%D0%B5%D1%80%D0%B5%D0%B2%D0%BE%D0%B4/)
                      Есть даже значение "решающий матч после ничейного результата".


                      1. l27_0_0_1
                        13.03.2016 19:03

                        Я не могу привести вам никакого другого сорса за исключением тонны людей на реддите и хн, которые говорят что это так. Вероятно, это было где-то на стриме, так что если вам интересно, можете поискать.


                  1. Welran
                    14.03.2016 06:47
                    +1

                    Так как при счете 3-1 нет смысла играть пятую партию и пятая партия играется если никто не выиграл в предыдущих, то разыгрывать нигири перед последней партией и разыгрывать нигири при равенстве очков это одно и тоже.


  1. lksdfj89
    13.03.2016 13:59
    +2

    У меня возникла пара вопросов.
    Комментатор говорил, что развитие alphago позволит найти новые техники и улучшит игру людей. Компьютер давно выигрывает в шахматы, но помогло ли это найти новые техники?
    Alphago будет одинаково отвечать на один и тот же ход или там есть доля случайности? Т.е. можно ли повторить этот матч 1 в 1 и победить не размышляя над ходами?


    1. valemak
      13.03.2016 14:11
      +4

      Компьютер давно выигрывает в шахматы, но помогло ли это найти новые техники?

      Вне сомнения. С помощью компьютерного анализа шлифуются дебютные варианты. Множество прорывов совершено в эндшпильной стадии (вплоть до того, что просчитаны все 6-ти фигурные окончания).

      Alphago будет одинаково отвечать на один и тот же ход или там есть доля случайности?

      Присутствует доля случайности в виде метода Монте-Карло. Повторение партии 1 в 1 невозможно.


      1. Mesmer
        13.03.2016 16:34
        +3

        Уже все 7-ми фигурные посчитаны.


      1. BelBES
        13.03.2016 16:43
        +1

        Присутствует доля случайности в виде метода Монте-Карло. Повторение партии 1 в 1 невозможно.

        Зависит от имплементации ГПСЧ, не? С одним и тем-же сидом, вероятно, партия должна повторяться 1 в 1.
        ну и, естественно, нужна та-же версия системы… и тут вполне вероятно, что альфу могут дообучать между партиями…


    1. KvanTTT
      13.03.2016 14:15
      +1

      Вряд ли- там как минимум используется метод Монте-Карло, который привносит элемент случайности.


    1. crazylammer
      13.03.2016 14:16
      +2

      Комментатор говорил, что развитие alphago позволит найти новые техники и улучшит игру людей. Компьютер давно выигрывает в шахматы, но помогло ли это найти новые техники?

      Я не специалист по шахматам, но вот заслуживающий внимания комментарий на английском:

      Any opening is pretty much playable given the right amount of analysis. Moves that were once considered not playable have found new life in painstaking objective analysis.

      Многие ходы в дебютах, которые до этого считались слабыми, получили новую жизнь

      … Basically, now anyone can prepare for anyone

      Раньше существовали более или менее закрытые (например, в СССР) "базы данных" про стили игры известных игроков. Сейчас с помощью AI такую информацию гораздо проще собрать и проанализировать.


    1. paniquehistoire
      13.03.2016 14:20
      +1

      Смотря насколько быстро обучается система. В долгосрочной перспективе определенно нет. В этом кстати нет большого отличия от человека (достаточно вспомнить любые случаи из жизни, когда повторяешь одну и ту же ошибку, уже зная о ней).


  1. lanseg
    13.03.2016 14:02
    +8

    А я за робота болел


    1. valemak
      13.03.2016 14:11
      +15

      Пятая колонна!


      1. a_batyr
        13.03.2016 14:16
        +9

        Я тоже за АльфаГо болел. За ИИ наше будущее. Слава Роботам!


        1. Namynnuz
          13.03.2016 14:48
          +10

          И вы серьёзно рассчитываете, что после этого комментария они вас пощадят?...


          1. valemak
            13.03.2016 14:51
            +14

            Шансов у людей в будущей войне со Скайнетом всё равно нет, единственная надежда на выживание — коллаборационизм :)


            1. Simplevolk
              13.03.2016 18:00
              +1

              Сара Коннор — единственная надежда человечества!


        1. PavelGatilov
          13.03.2016 22:03
          +2

          А я всегда считал что будущее за апдейтом человеческого мозга и тела.


          1. ankh1989
            14.03.2016 07:51
            +1

            Роботы тоже так думают (вспомнил Quake 4 где строгги "улучшали" людей и заставляли воевать за себя).


  1. evtomax
    13.03.2016 14:05
    -4

    Один человек сражался с целым дата-центром? Мне кажется, что надо ввести ограничение на потребляемую компьютером мощность. 200 Вт, например.


    1. Kroid
      13.03.2016 14:21
      +8

      Ага, и количество нейронов заодно.
      /irony


    1. KvanTTT
      13.03.2016 14:28
      +7

      Если подвести к человеку десятки кВт энергии, то играть он от этого лучше не станет. Этот вопрос уже обсуждался.


      1. evtomax
        13.03.2016 14:31

        А если против дата-центра будет играть команда из 1000 человек?


        1. Sleepwalker_ua
          13.03.2016 14:39
          +3

          попробуйте сначала согласовать 1000 человек. Это вам не это…
          У каждого собственное мнение, видение игры, личный опыт, гордость, стремление к лидерству, тщеславие… Будет не игра, а фарс.


          1. evtomax
            13.03.2016 14:52
            +1

            Если я не знаю, как эффективно согласовать 1000 человек в данной игре, то это не значит, что такое невозможно.


            1. Frosterman
              13.03.2016 17:14
              +2

              Ну вот когда человечество выйдет на новый уровень биологического или технического развития и сумеет объединять или синхронизировать сознания в реалтайм режиме. В текущем варианте даже 10 человек в совместной игре воспроизведут ситуацию из басни Крылова и на выяснение чья идея лучше будет уходить гигантское кол-во времени и внимания.

              Актуальней давать игроку больше времени на обдумывание. Практически во всех партиях у Седоля кончалось время и принимать важнейшие решения ему приходилось всего за 1 минуту.


              1. evtomax
                13.03.2016 18:19
                +1

                Толпа — не единственный возможный способ организации деятельности большого количества людей.


          1. PavelGatilov
            13.03.2016 22:04

            Обычная демократия? Собрать 1000 игроков А класса в ГО, а дальше за каждый ход или стратегию голосовать


            1. Necrozyablo
              13.03.2016 23:20
              +2

              Смысла нет. Даже в топ100 разница между 1 и 100 в 300 эло. При 1000 будет разница от 3600 до 2500 эло.
              Есть к слову турниры командные, где ходы обсуждаются, но даже там больше чем 3 человека на команду нет.
              Фактически можно взять человек 5-10 самых топовых и чтобы они сами из каждого хода играли и обсуждали варианты, тогда думаю профит будет. Но для этого нужно на партию выделять минимум часов 20. На этом шоу тяжело построить.


            1. DeepBlue
              14.03.2016 04:37
              +3

              Практика показала, что демократия в шахматах неэффективна:
              en.wikipedia.org/wiki/Kasparov_versus_the_World
              Сомневаюсь, что в го выйдет лучше.


              1. roboq6
                14.03.2016 05:37
                +1

                Там потом оказалось, что Каспаров читал обсуждения коллективной стратегии The World Team.


        1. KvanTTT
          13.03.2016 14:43
          +2

          Такое количество людей не успеют синхронизироваться не только за игровое время, но и вообще за какое-то приемлемое время. А если время увеличить на порядок, то и компьютер станет глубже считать. Если брать слаженную команду до 10 человек, то может качественно что-то и улучшится.


    1. tzlom
      13.03.2016 19:17
      +2

      Ну конечно, а отдел бухгалтеров умнее Эйнштейна.


      1. valemak
        13.03.2016 19:49
        +2

        Если это касается скользких вопросов бухгалтерии, со всеми этими минимизациями налогов и при этом чтобы в тюрьму не сесть — и один толковый бухгалтер может оказаться умнее Эйнштейна.


      1. evtomax
        13.03.2016 20:23
        +3

        Эйнштейн гениальный физик. Но сомневаюсь, что он смог бы заменить отдел бухгалтеров.


        1. mva
          13.03.2016 22:35
          -1

          Вообще-то, математик...


          1. upsilon
            13.03.2016 23:22
            +4

            Раскроете свою мысль?


          1. sevikl
            14.03.2016 13:23
            +4

            Вообще-то эксперт в патентном бюро


    1. plm
      14.03.2016 04:37

      Вот это меня тоже возмущает. Но на мой взгляд надо ввести ограничение какое-то более относящееся к обоим партнерам. Максимальный вес, например. Вики говорит, что самый тяжелый человек весил 635 кг (хотя статью про самых тяжелых игроков в го не искал), вот пусть в эту массу впихивают все. Если во время игры можно есть-пить — компу повезло, топливо для генератора на всю игру можно не учитывать в этом весе. И никаких подсказок со стороны.


  1. pnetmon
    13.03.2016 14:11
    +1

    Для шоу лучший вариант — будет внимание к пятой партии.


    1. lksdfj89
      13.03.2016 14:12
      +7

      Лучший вариант для шоу — 2:2.


  1. Cr558
    13.03.2016 14:33
    -17

    Закидайте меня помидорами, добейте карму, но я думаю это шоу. Слишком драматично, эпично и все дела. Взяли не самого сильного игрока, но самого так понимаю колоритного из лучших. Сначала сделали сенсацию выиграв 3и подряд, теперь, интрига человека выиграл. Причем кто, кому поддается еще неизвестно. Может программа слабее, чем думают, может её ослабили для обострения ситуации, может AlphaGo лишь инструмент, а удаленно с помощью просчетов позиции на кластере играет комманда высокого уровня. А может я параноийю весной схватил. Но вот клянусь моей шапочкой из фольги, маркетологи бы сделали так, 5:0 неинтересно, а вот 3:2 или 4:1 и политически корректно к белковыми, и привлечет их внимание. А может это шоу в стиле смотрите какой гугл молодец. Пойду таблеток выпью, чтоле.


    1. GreenGoblin
      13.03.2016 14:50
      +7

      Едва ли. В Азии к го относятся очень серьезно, гроссмейстеров почитают как национальных героев, всякие пафосные титулы им выдумывают. А если посмотреть на проигрывающего Седоля, все мысли о подставе должны сразу отпасть.
      Да и гуглу это тоже ни к чему, в конце концов победа робота была вопросом времени, а миллион зелени для него — капля в море.


    1. dom1n1k
      13.03.2016 16:52
      +2

      Когда канадцы проиграли свой домашний ЧМ по хоккею, некоторые тоже говорили, что там все куплено :) Лично слышал своими ушами.


    1. Frosterman
      13.03.2016 17:27
      +2

      сразу видно человека который мало или вообще не играл против компа. Возьми любой файтинг или стратегию где приходится играть против ИИ. Выбери режим hardcore и получится стандартный расклад для среднестатистического игрока: первые стычки проигрываются вчистую, затем изучение тактики и алгоритмов ИИ и выстраивание контр-стратегии, затем первые удачи и в итоге гарантированные победы с минимальными усилиями. Для игрока который прошёл все эти стадии игра против этого ИИ уже теряет смысл т.к. победа достаётся слишком легко и предсказуема. Так и тут — если Ли Седоль нащупает слабые стороны ИИ, то сможет эффективно их использовать раз за разом. Вопрос только в том что с той стороны сидят программисты которые так же внимательно следят за косяками своего детища и в состоянии подкрутить алгоритм в перерывах между играми. Но в любом случае я бы не удивился результатам в стиле fail — fail — fail — win — win — win


      1. roboq6
        13.03.2016 17:35
        +1

        >Вопрос только в том что с той стороны сидят программисты которые так же внимательно следят за косяками своего детища и в состоянии подкрутить алгоритм в перерывах между играми.

        Важная фишка AlphaGo это самообучение. Поэтому в отличии от игровых ИИ Alphago не будет каждый раз наступать на одни и теже грабли.


        1. Frosterman
          13.03.2016 17:56
          +3

          сомневаюсь что на анализе одной единственной партии Alphago сумеет чуть ли не в реальном времени перестроить всю свою стратегию. Так может человек, но не ИИ построенный на современной реализации нейронных сетей.


      1. Cr558
        14.03.2016 01:55
        +1

        Пальцем в небо. Как раз имею опыт игры против ИИ в шахматы и за 3и партии выяснить слабые места, так, чтобы вчистую выиграть невозможно, если только изначально его непревосходишь в разы. Го так же игра с полной информацией и здесь фишки как в героях/старкрафте и т.п. где компьютер не знает, что вы там на базе делаете и куда ведете основные силы не прокатят. Если всего за 3и игры Седоль нащупал выигрышную стратегию это говорило бы о слабости ИИ.

        Кармы мало, поэтому отвечу здесь и другим. Все эти сказки о том как в Азии чтут Го, что прям сенсей сделает харакири если проиграет, напоминают небылицы, что все русские прям дофига шахматисты времен СССР. Да, у них есть традиция, но ненадо думать, что чм по Го, шахматам или городкам нельзя купить. Что прям в Азии все по чину. Вы еще экскурсоводам поверьте в курортном городке. Коррупция в том же Китае не хуже российской, куда больше, чем в США, за Южную Корею не знаю, но думаю не лучше Западной Европы. Поэтому детскую веру в принципиальных азиатов оставьте там же где жители Сибири ходят в обнимку с медведями, грузины все как один гостепреимные, евреи богатые, а французы донжуаны. Именно интрига выгодна всем, от Ли Седоля до Гугла. Если не понимаете почему так, почитайте те же азиатские тракты типа «Искусства войны».


        1. Welran
          14.03.2016 07:31
          +1

          Ну 3-0 это не интрига. вот было 2-1 тогда была бы интрига сумеет ли чемпион мира обыграть бездушную машину. А потом ещё и 2-2 вообще бы подогрело интерес. А так никакой интриги которая была бы «выгодна всем».


          1. Cr558
            14.03.2016 10:49
            +2

            3:0 — нет, а вот 3:1после 3:0 уже интрига. После 4:0 почти все бы интерес потеряли, списав белковых на свалку истории.


            1. sim31r
              14.03.2016 13:10
              +1

              А при счете 3:2 общество потребует продолжения игры, интерес сохранится на годы.


        1. valemak
          14.03.2016 07:35

          Про харакири была шутка, разумеется, высмеивающая как раз стереотипы про азиатов. Тем паче, что харакири, вроде как, не входит в корейскую традицию.


  1. KvanTTT
    13.03.2016 14:47
    +4

    Гугл заинтересован в победе в сухую, и это как раз таки очень эффектно было бы. Поэтому намеренно ослаблять AlphaGo у него точно нет резона.


  1. ZlodeiBaal
    13.03.2016 16:05
    +2

    Мой друг, который очень круто в Го играет говорит, что первая ошибка была на 23 ходу. Это какая-то очень стандартная комбинация, в которой альфа го сыграл как новичок. Потом бот повторил два раза ход из второй партии (на 25 и 47 ходу), который тогда Ли поверг в шок, а теперь Ли уже явно подготовился как против такого играть. Ну и да, потом серия явных ошибок, особенно после большого окружения.


    1. f0rk
      13.03.2016 22:47
      +7

      Судя по вашему комментарию, ваш друг не очень круто играет в го. "ход из второй партии" — это стандартный прием, даже название у него есть — "удар в плечо". Его необычность во второй партии в том что он был сделан по отношению к камню стоящему на 4-й линии, к камню на 3-й (как в последней партии) его играют достаточно часто и ничего необычного в этом нет. Между прочим, до хода 78 и последующей комбинации в центре, позиция на доске многими профессионалами оценивалась как благоприятная для белых. Ход E4 (23-й) тоже не выглядит как ошибка, скорее как проверочный ход. Ли Седоль потратил 2 хода чтобы этот камень забрать, мне сложно оценить эту комбинацию, но по моему субъективному мнению не очень крутого игрока (3 дан РФГ), плохим этот ход назвать сложно, и уж точно не тянет это на "игру новичка".


      1. ZlodeiBaal
        15.03.2016 01:56

        Да, не очень, наверное. 4д на европейском сервере, 6д на китайском и корейском
        В России вроде года 3-4 назад дошёл до 2д, потом забросил местные турниры. По рейтенгу РГФ был топ-20 тогда, чемпион Питера.

        Я сам играть не умею. Сказанное мной он озвучивал с отсылкой к разбору партии Ли Седоля 9ми данами. Там есть два англоговорящих, один американец, один китаец.


        1. f0rk
          15.03.2016 14:43

          Как-то не сходится все. 2д никогда не мог быть в топ-20 РФГ, этого недостаточно даже чтоб в сотню войти, хоть сейчас, хоть 3-4 года назад. Да и чемпионат Питера 2д вроде не выигрывал на моей памяти. И не могу я поверить, что 4д скажет что E4 это ход новичка (разборы партий я тоже смотрел). Не скажете как вашего друга зовут?


          1. ZlodeiBaal
            15.03.2016 15:10

            Евгений Дергач его зовут.
            Точность формулировок я мог не сохранить, но смысл был примерно такой. Е4 -явный оверплэй, свойственный новичкам, два удара в плечо — ни о чём, причём первый — ошибка Ли что он не ответил агрессивно.


            1. f0rk
              15.03.2016 15:55
              +1

              Е4 -явный оверплэй

              Спорная формулировка, такой ход в принципе играют, можно подумать над тем, насколько вовремя он был сыгран.

              свойственный новичкам

              Вот это точно нет. Там есть хорошие продолжения. Если новичек и может сыграть такой ход, то только случайно :)

              два удара в плечо — ни о чём

              Первый был вполне о чем, и он как раз был связан с продолжениями в углу, для того чтобы сыграть более агрессивный ход в углу, черному потребовалась бы поддержка на стороне. Второй более спорный на мой взгляд, я бы накрывал через пункт сверху в такой позиции, но не мне судить машину, которая мне камней 6 форы дать может :)

              Но в текущей формулировке, у меня гораздо меньше желания назвать написанное ерундой.


    1. f0rk
      14.03.2016 01:04
      +3

      Ну и да, потом серия явных ошибок, особенно после большого окружения.

      Явная ошибка со стороны альфаго была в партии только одна, 97-й ход C4 и произошла она после того как бот "понял" что шансы на выигрыш явно упали. Возможно, что это связано с алгоритмом, который не учитывает величину выигрыша/проигрыша в очках, его единственная цель максимизировать вероятность выигрыша не зависимо от его величины. Думаю что инженерам гугла стоит подумать о том, чтобы в ситуациях, когда бот проигрывает, он менял стратегию и начинал играть на уменьшение отрыва а не на увеличение вероятности выигрыша. Если отрыв в очках сократить, то появляется возможность обыграть человека в концовке.


  1. dom1n1k
    13.03.2016 16:54
    -1

    Мне кажется, цвет нужно было не разыгрывать, а чередовать.
    Плюс я бы дал человеку право выбора цвета в первой партии.


  1. yefrem
    13.03.2016 16:54

    Как и в первой и второй играх, Седоль исчерпал время раньше оппонента. То есть в какой-то момент человек был вынужден тратить всего по минуте на ход.

    Э… ограничение времени при игре с ИИ? Но ведь это нечестно, разве нет? Может я не понял из-за того, что не играю в го, но звучит очень странно.


    1. Frosterman
      13.03.2016 17:52
      +2

      Стандартные правила игры в Го, по которым играют оба. А правила проверены временем и ориентированы на физические возможности человека. Без проф подготовки поиграть в Го против равного или более сильного игрока много не получится — уже через 2-3 часа такой игры ощущаешь себя как выжатый лимон и физической усталостью сравнимой с пробежкой в десятки км. Да и растягивали бы эти партии фиг знает как — проигрывающий игрок будет до последнего тянуть при каждом ходе пытаясь найти выход из патовой ситуации…
      Да и насчёт честности тут тоже не всё так просто — если дать человеку больше времени, то придётся его же давать и ПК. А это — лишние итерации и возможность дальше просчитать последствия хода. При наличии неограниченного времени ПК даже с самыми примитивными алгоритмами будет иметь 100% шанс победы


      1. RMV1983
        13.03.2016 18:03
        +1

        Стандартные правила игры в Го, по которым играют оба. А правила проверены временем и ориентированы на физические возможности человека.

        Правильно. Человека. Вот он и упёрся в эти ограничения. Для ИИ ограничения должны быть другими.
        Хотя для первых игр важна принципиальная победа ИИ.

        При наличии неограниченного времени ПК даже с самыми примитивными алгоритмами будет иметь 100% шанс победы

        Не согласен. В этом случае скорее вопрос кто кого переживёт. Вроде бы срок службы микросхем пока что меньше продолжительности жизни человека.
        (Вспомнилась почему-то притча про Ходжу Насредина. И его фраза. Либо ишак, либо падишах, либо я.)


        1. Frosterman
          13.03.2016 18:48
          +1

          Правильно. Человека. Вот он и упёрся в эти ограничения. Для ИИ ограничения должны быть другими.

          возможно. Но тут уже проблема как высчитать эти ограничения. Для ИИ ограничение времени на ход имеет даже более серьёзные последствия, чем для человека. Человек в конце концов может сделать ход инстинктивно, а вот пк без точных расчётов превращается в дебила. Те же блиц партии с 15ти секундными ходами AlphaGo вряд ли сможет выиграть даже у более слабого противника.

          Имхо самый интересный вариант сейчас был бы с партией растянутой на несколько месяцев. Скажем 12 часов днём отдаётся человеку на ход и 12 часов ночью для ПК. Обмен ходами раз в сутки. Это даст максимальную фору обоим участникам и позволит использовать все свои ресурсы и возможности для обоих сторон.


          1. RMV1983
            13.03.2016 19:45
            +1

            возможно. Но тут уже проблема как высчитать эти ограничения.

            Я предлагаю подойти с другой позиции. В каком направлении мы бы хотели видеть развитие техники? И уже отсюда придумывать ограничения. Ведь понятно что какие бы ограничения придуманы не были, их будут пытаться обойти. Так пусть пытаются в той сфере, что даст пользу всей отрасли, а не её отдельному сегменту.
            Это касается качественных характеристик, т.е. того — что вообще стоит ограничивать?
            А по поводу количественных, т.е. конкретных значений всё проще, мне кажется.
            Сейчас же не проводятся регулярные соревнования и вопрос пока ещё не такой острый.
            Нужно взять текущее состояние AlphaGo. И с каждым годом уменьшать его, скажем на 10%. Конкретное значение можно брать скажем из среднего прироста в отрасли. Это оставит множество векторов для развития. А если окажется, что этого не достаточно и ИИ выигрывает в 100%, то тогда можно будет подумать над ещё одной качественной характеристикой.
            Вообще, этот вопрос сейчас мало актуален, поскольку любое нормальное ограничение урежет возможности ИИ слишком сильно. Здесь мне видится актуальным именно постепенное поступательное изменение/улучшение.

            А ваш вариант интересный, согласен. Особенно сейчас, когда человек ещё может победить.


    1. agranom555
      13.03.2016 17:53
      +2

      Время хода ограничено. Все правильно. Ведь тогда и ИИ может думать па часу на ход. А так тоже вынужден быстро думать


    1. RMV1983
      13.03.2016 18:05
      +2

      Э… ограничение времени при игре с ИИ?

      Я вот тоже не понимаю.

      То есть в какой-то момент человек был вынужден тратить всего по минуте на ход. AlphaGo же хорошо распоряжалась временем — это результат добавления нейросети, которая помогает управлять им.

      Канал нужен для связи с дата-центрами компании, где на сотнях процессорных ядер и видеоускорителей запускается AlphaGo.

      При чём здесь эффективность нейросети, если используется огромнейший кластер? Если производительность по времени будет недостаточной, то, насколько я понимаю, мощность можно увеличить. И делать так дотех пор, пока скорость не станет приемлемой.
      Да, нейросеть вещь необходимая. Но именно мощность вычислений ничто (кроме денег) не мешает нарастить другим путём.
      У человека же мощность, в силу биологических причин, пока что, нарастить не представляется возможным.

      Должно быть какое-то ограничение. А то так (условно конечно) все сервера гугла можно на ограниченное время подключить к расчётам, а потом удивляться, что эта система принимает решение быстрее человека.
      Да, победа без ограничений это важный шаг. Можно сказать, принципиальный. И теперь вопрос лишь в мощности. А значит, что пора придумывать ограничения.

      Да, я уже видел ветку с ограничением по мощности. Забавно. Если такое примут, то будет развиваться энерго-эффективность. Но принять такое ограничение для всег кластера… мне кажется не реально. Но согласен, к этому можно стремиться.
      Есть ещё идея, на будущее. ИИ должен присутствовать на состязании целиком. И успевать "сесть за стол" за то же время, что и человек. Опять же, прямо сейчас это не реально.

      В будущем, мне кажется было бы не плохо постепенно вводить эти ограничения. В таком случае, мы получим прогресс в миниатюризации энерго эффективности. Уже сейчас можно начать, установив текущие мощности AlphaGo как максимальную планку. И договорившись понижать е каждый год. Причём даже не важно насколько.
      Можно даже забить на всё это и придумать нечно иное. Но миниатюризация и энерго эффективность мне кажутся более предпочтительными. Что насчёт иметь своего персонального AlphaGo на телефоне или умных часах и не переживать по поводу батареи?


      1. Here_and_Now
        13.03.2016 19:50
        +1

        Для начала, мне кажется, DeepMind и Google будут решать проблему самого ИИ в том или ином виде.

        А проблема энерго-эффективности — она решается на уровне самого гугла. Скажем DeepMind добавят что-то в поисковый движок, и команда гугла будет работать над оптимизацией. Т.е. энерго-эффективность только тогда, когда алгоритм интенсивно работает над real world problem.


  1. Zavtramen
    13.03.2016 18:48
    +5

    Канал нужен для связи с дата-центрами компании, где на сотнях процессорных ядер и видеоускорителей запускается AlphaGo

    И какую же именно информацию они гоняли от доски до дата-центра что им потребовался отдельная оптика? Просто перестраховались за связь вообще, а написали так, как будто там видео-стримингом занимались. По сути там и мобильного Edge много было бы )


  1. Here_and_Now
    13.03.2016 19:44
    +3

    Так и представляю, как сегодня ночью перед следующей игрой, Альфа Го будет посылать армии друг на друга, эмулируя проигранную игру снова и снова, а какой-то внутренний процесс подкрепления с плёткой будет приговаривать "Не делай больше таких глупых ошибок".


    1. Halt
      13.03.2016 20:08
      +2

      Справедливости ради стоит отметить, что этого не происходит. Разработчики уже заявляли, что между партиями программу не модифицируют и в процессе никаких рычагов воздействия не имеют. Видимо посчитали, что так будет интереснее.


      1. RomanStrlcpy
        13.03.2016 21:52
        +2

        А самообучени в процессе игры происходит?


        1. zagayevskiy
          13.03.2016 22:02
          +4

          Одна игра ни на что повлиять не может, скорее всего.


        1. Halt
          14.03.2016 07:25
          +4

          Чтобы обучаться на текущих ходах, надо знать их реальный исход. Если партия была выиграна, то сети накидывается поощрение, ход за ходом.

          Подозреваю, что в течение партии этого не делают, ибо на руках у машины будет только оценка вероятности успешного исхода партии из заданной позиции, ну и прикидки монте-карло, которые тоже могут быть необъективными (как показала нам 4 партия).


  1. solariserj
    13.03.2016 22:45

    Ну ИИ называют по традиции с машинным противником. Он ведь построен на нейронной сети, то есть такая "китайская комната" натренированная делать определенные ходы в определенных ситуациях. Поэтому с таким подходом можно любую логическую игру выйграть, главное грамотно описать


    1. SkidanovAlex
      14.03.2016 06:12
      +11

      Утверждается, что люди будут всегда называть ИИ систему, способную решать множетсво задач, которые еще не решены текущим ИИ, а все, что решает текущий ИИ, называть не настоящим ИИ: о)

      Ваш мозг тоже построен на нейронной сети, то есть это тоже такая "китайская комната" натренированная на какие-то базовые задачи, многие из которых более тривиальны, чем игра в го. В частности, она пока у вас плохо научена правильно писать слово "выиграть".


  1. SkidanovAlex
    14.03.2016 06:07
    +1

    Система признаёт поражение, когда оценка шанса победы падает ниже 20 процентов

    Это не верно, согласно этой статьи: https://habrahabr.ru/post/279071

    AlphaGo сдается, если у всех ходов Q-score < -0.8, т.е. вероятность выиграть меньше 10%.


    Интересно, что в октябре Фань Хуэй тоже выигрывал у AlphaGo, но только в одной из пяти неформальных игр.

    это тоже не верно, он выиграл в двух из пяти, и там было важное ограничение — 30 секунд на ход: https://gogameguru.com/go-commentary-deepmind-alphago-vs-fan-hui-game-5

    He won two unofficial games against AlphaGo (30 seconds per move), but lost all the official games.


    1. atomlib
      14.03.2016 06:23
      +1

      Данные про 20 процентов — это слова инженера Google. Про две игры исправил, спасибо.


  1. Greatschemer
    14.03.2016 09:16

    "Да придёт спаситель".


  1. sim31r
    14.03.2016 13:18
    +3

    Удивила логика программы. Есть вероятность выиграть, хоть и 20%, а она сдается. Такое может быть обоснованно при экономии облачных мощностей. Но на этапе обучения мощности требовались выше, чем при игре, так что вариант отпадает.


    1. vxd_dev
      14.03.2016 15:27
      +2

      Мне, наоборот, это кажется логичным, ведь если твой противник в данной конкретной игре смог снизить твои шансы до 20% (выше упоминалось 10%), то в данный момент он сильнее и нужно ждать откровенной ошибки с его стороны, чтобы изменить ситуацию, а тут, насколько я понимаю, еще появляется лимит по времени.


      1. roboq6
        14.03.2016 15:32
        +4

        Ну и что? Если наша цель — победа любой ценой (а именно на это запрограммирован AlphaGo), то надо сражаться до конца, какими бы призрачными не становились наши шансы на победу.


        1. Lure
          15.03.2016 13:21
          +1

          Кстати, в покере при игре вживую всегда есть ненулевой шанс выиграть даже если соперник собрал старшую возможную комбинацию и не собирается сбрасывать. Причём, выигрыш в таком случае случится без нарушения правил. Но это крайне маловероятная ситуация.


    1. atomlib
      14.03.2016 15:40
      +4

      Это заложено намеренно для сохранения культуры поединка, чтобы не получалось, что машина продолжает играть, хотя проигрыш уже очевиден.


      1. roboq6
        14.03.2016 16:00
        +2

        А что, в Го нету такого момента когда противник просто вынужден окончить игру, как мат в шахматах?


        1. valemak
          14.03.2016 16:19
          +3

          Да и в шахматных поединках (если это солидное соревнование, а не во дворе на лавочке играют) тоже не играют до мата включительно.

          Если тянуть до последнего, тот тут одно из двух. Или надеешься что соперник грубо ошибётся и своим нелепым ходом даст шанс. Это полнейшее неуважение к сопернику, особенно если это игрок высшей категории. Как будто надеешься, что перед тобой на самом деле не гроссмейстер, а какой-то дурачок.

          Или же речь о том что противник в цейтноте, израсходовал своё время и вот-вот на его часах упадёт флажок. Тогда вполне корректно продолжать игру. Однако в го обычно контроль времени, в котором цейтнота как такового практически возникнуть не может. В худшем случае у противника 1 минута на 1 ход. Для игрока уровня Седоля это абсолютно достаточно, чтобы спокойно закрепить победу.


        1. valemak
          14.03.2016 16:24
          +2

          Кроме того в го аналога мата нет. По окончанию игры подсчитываются очки.

          Если в шахматах часто есть призрачный шанс подловить соперника на внезапную комбинацию, то го это игра в которой столь внезапные повороты в заключительной стадии партии практически исключены. В конце партии игроки пожинают плоды своей терпеливой стратегии, если у кого-то очевидный выигрыш, то надеяться на чудо не приходится — таковы особенности игры.


      1. vlivyur
        14.03.2016 16:19
        +1

        10% шанс на победу это далеко не очевидный проигрыш.


        1. valemak
          14.03.2016 16:29
          +2

          Смотря что за игра. В шахматах одна удачная комбинация может всё перевернуть с ног на голову. В го совершенной другой характер игры, если преимущество опытного противника достаточно большое, то на спасение шансов практически нет.


          1. SkidanovAlex
            14.03.2016 19:27
            +1

            то на спасение шансов практически нет.

            Тогда это и не шанс 10%. Шанс 10% — это достаточно ортогональная типу игры вещь, которая говорит, что если бы мы сейчас вселенную форкнули раз так миллион, то в 100К вселенных мы бы выиграли. Учитывая специфику го, это на деле должно обозначать достаточно близкую позицию с незначительным перевесом.


            1. valemak
              14.03.2016 19:39
              +1

              Насколько я понимаю из объяснений по поводу того как AlphaGo с помощью метода Монте-Карло ищет оптимальный новый ход, то могу предположить по поводу упомянутых 10-20% примерно следующее:

              Из возможных условно случайных продолжений игры, в 10% вариантов преимущество у компьютера, 90% — у человека. Но это отнюдь не значит, что на практике вероятность того что, что реальная игра с вероятностью 10-20% пойдёт по пути из этих 10-20%, найденных с помощью метода Монте-Карло. Так как противник-человек пользуется не методом Монте-Карло, а просто идёт по очевидно выигрышному пути, то выигрышные для него "монтекарловские" 90% в реальности — это больше 99%.


  1. kazaff
    15.03.2016 22:18
    +1

    youtu.be/mzpW10DPHeQ
    9 часов назад уже сыграли пятую игру.