В марте состоится матч го-профессионала 9 дана и искусственного интеллекта компании Google


Ни один компьютер пока не в состоянии обыграть профессионального игрока в азиатскую настольную игру го. Дело в особенностях игры: позиций слишком много, а интуицию человека сложно описать алгоритмически. Мир придерживался подобных мнений до 27 января. Несколько дней назад компания Google опубликовала данные исследования своего подразделения DeepMind. В нём рассказывается о системе AlphaGo, которая в октябре прошлого года смогла обыграть профессионального игрока второго дана Фань Хуэя в 5 играх из пяти.

Тем не менее у профессиональных игроков и знакомых с го возникли вопросы по качеству игры. Хуэй — трёхкратный чемпион, но он чемпион Европы, где уровень игры не слишком высок. Вызывает вопросы не только выбор игрока для демонстрации силы AlphaGo, но и некоторые ходы в партиях.

Алгоритм


Го давно считается игрой, обучить в которую искусственный интеллект затруднительно из-за огромного пространства поиска и сложности выбора ходов. Го принадлежит к классу игр с совершенной информацией, то есть игроки знают обо всех ходах, которые ранее совершили другие игроки. Решение задачи поиска исхода игры связано с вычислениями функции оптимального значения в дереве поиска, содержащем приблизительно bd возможных ходов. Здесь b — это количество корректных ходов в каждой из позиций, а d — длина игры. Для шахмат эти значения составляют b ? 35 и d ? 80, и полный поиск не представляется возможным. Поэтому позиции фигур оцениваются, а потом оценка учитывается при поиске. В 1996 году компьютер впервые выиграл в шахматы у чемпиона, а с 2005 года ни один чемпион уже не в состоянии выиграть у компьютера.

Для го b ? 250, d ? 150. Возможных позиций камней на стандартной доске более, чем в гугол (10100) раз больше, чем в шахматах. Число возможных позиций больше, чем атомов во Вселенной. Осложняет ситуацию то, что предсказать ценность состояний трудно из-за сложности игры. Два игрока размещают камни двух цветов на доске определённого размера, стандартное поле — это 19?19 линий. Правила варьируются деталями, но основная цель игры проста: нужно отгородить на доске камнями своего цвета территорию большего, чем соперник, размера.

Существующие программы умеют играть в го на уровне любителей. Они используют поиск в дереве Монте-Карло для оценки ценности каждого состояния в дереве поиска. Также в программы заложены политики, которые предсказывают ходы сильных игроков.

В последнее время глубинные свёрточные нейронные сети смогли добиться хороших результатов в распознавании лиц и классификации изображений. В Google ИИ даже самостоятельно научился играть в 49 старых игр Atari. В AlphaGo похожие нейросети истолковывают положение камней на доске, чем помогают оценить и выбрать ходы. В Google исследователи применили следующий подход: они использовали сети ценности (value networks) и сети политики (policy networks). Затем эти глубинные нейросети обучаются как на множестве партий людей, так и на игре против своих копий. Новым является также поиск, объединяющий метод Монте-Карло с сетями политики и ценности.


Схема обучения нейросети и архитектура.

Нейросети натренировывали в нескольких стадиях машинного обучения. Сначала проводилось контролируемое обучение сети политики прямо с помощью ходов игроков-людей. Другая сеть политики подвергалась обучению с подкреплением. Вторая играла с первой и оптимизировала её, чтобы политика сдвигалась к выигрышу, а не просто предсказаниям ходов. Наконец, проводилось обучение с подкреплением сети ценности, которая предсказывает победителя игр, в которые играют сети политики. Конечный результат — это AlphaGo, комбинация метода Монте-Карло и сетей политики и ценности. Был достигнут результат корректного предсказания следующего хода в 57 % случаев. До AlphaGo лучший результат составлял 44 %.

В качестве входных данных для обучения использовались 160 тыс. игр с 29,4 млн позиций с сервера KGS. Брались партии игроков с шестого по девятый дан. Миллион позиций был выделен для тестов, а собственно обучение велось на 28,4 млн позиций.


Сила и точность сетей политики и ценности.

Для работы алгоритмов нужны на несколько порядков большие вычислительные мощности, чем при традиционном поиске. AlphaGo представляет из себя асинхронную многопоточную программу, которая выполняет симуляцию на ядрах центрального процессора и запускает сети политики и ценности на видеочипах. Финальная версия выглядела как 40-поточное приложение, запускаемое на 48 процессорах (вероятно, имелись в виду отдельные ядра или даже гиперпоточность) и 8 графических ускорителях. Также была создана распределённая версия AlphaGo, которая использует несколько машин, 40 потоков поиска, 1202 ядер и 176 видеоускорителей.

Полностью с отчётом DeepMind можно ознакомиться в документе.


Поиск Монте-Карло в AlphaGo.

Для оценки способностей AlphaGo проводились внутренние матчи как против других версий программы, так и других подобных продуктов. В том числе сравнение велось с такими популярными коммерческими программами, как Crazy Stone и Zen, и сильнейшими открытыми проектами Pachi и Fuego. Все они основаны на высокопроизводительных алгоритмах метода Монте-Карло. Но также AlphaGo сравнили с немонтекарловской GnuGo. Программам отводилось по 5 секунд на ход. Проводилось сравнение как запускаемой на одной машине AlphaGo, так и распределённой версии алгоритма.

Как заявляют разработчики, результаты показали, что AlphaGo на много данов сильнее любых предыдущих го-программ. AlphaGo выиграла 494 из 495 игр, то есть 99,8 % матчей против других подобных продуктов. Правила го допускают фору, гандикап: на поле можно установить до 9 чёрных камней до хода белых. Но даже с 4 камнями форы одномашинная AlphaGo выигрывала в 77 %, 86 % и 99 % случаев против Crazy Stone, Zen и Pachi, соответственно. Распределённая версия AlphaGo была значительно сильнее: в 77 % игр она побеждала одномашинную версию и в 100 % игр — все остальные программы.


AlphaGo против других программ.

Наконец, созданный продукт сравнили с человеком. Против распределённой версии AlphaGo сразился профессиональный игрок 2 дана, победитель Чемпионата Европы по го в 2013, 2014 и 2015 годах Фань Хуэй. Игры проводились при участии судьи из Британской федерации го и редактора журнала Nature. Было проведено 5 игр в период с 5 по 9 октября 2015 года. Все из них выиграл алгоритм разработки Google DeepMind. Именно эти игры стали поводом к заявлению, что компьютер впервые смог обыграть профессионального игрока в го. Кроме 5 официальных партий были проведены 5 неофициальных, которые не шли в зачёт. Две из них Фань выиграл.

Доступны записи ходов пяти игр, просмотр в веб-виджете и ролики на YouTube.

Критика от профессиональных игроков


Сомнению подвергается выбор профессионального игрока и слабая игра чемпиона. Также неясны выбранные правила: час на партию вместо нескольких часов серьёзных игр. Впрочем, формат выбирал сам Хуэй. В марте AlphaGo будет играть против Ли Седоля. Сможет ли алгоритм обыграть корейского профессионала девятого дана, считающегося одним из лучших игроков в мире? На кону миллион долларов. В случае победы человека его получит Ли Седоль, в случае победы алгоритма он уйдёт на благотворительность.

Исследователи заявляют, что во время октябрьского сражения с человеком система AlphaGo рассматривала в тысячи раз меньше позиций, чем Deep Blue во время исторического матча с Каспаровым. Вместо этого программа использовала сеть политики для более умного выбора и сеть ценности для более точной оценки позиций. Возможно, подобный подход ближе к тому, как играют люди, говорят исследователи. Кроме того, система оценки Deep Blue была запрограммирована вручную, в то время как нейросети AlphaGo натренированы прямо из партий игры с помощью универсальных алгоритмов контролируемого обучения и обучения с подкреплением.


Ли Седоль попробует свои силы против AlphaGo в марте.

Профессиональные игроки высказывают различные точки зрения. Кому-то кажется, что Google специально выбрала не слишком сильного игрока, кто-то уверен, что Седоль проиграет уже в этом марте.

Один из сильнейших англоговорящих профессиональных игроков в го Ким Менгван (девятый дан) считает, что Фань Хуэй играл не в полную силу. На 51-ой минуте видеоролика он приводит конкретный пример из второй партии. Возможно, Фань играл как с более слабым, чтобы проверить силу компьютера, говорит Ким. Менгван признал, что AlphaGo — шокирующе сильная программа, но она вряд ли сможет победить Ли Седоля.



Судья матча Тоби Мэннинг рассказал в издании British Go Journal о матче. Он провёл анализ всех пяти игр и выделил некоторые моменты. Во второй, третьей и четвёртой партиях AlphaGo допускала ошибки, но Фань не воспользовался ими. Трёхкратный чемпион Европы отвечал собственными. Статья в журнале заканчивается общей положительной оценкой AlphaGo: программа сильна, но неясно, насколько.

Также при подготовке материала я получил комментарии от российских профессионалов и любителей го. Александр Динерштейн (Казань), третий дан (профессиональный), семикратный чемпион Европы:

В матчах с Каспаровым над дебютом программы Deep Blue работала целая группа сильных гроссмейстеров. Возможно, что и к матчу с Ли Седолем такая команда будет собрана, но по матчу с Фань видно, что работа в этом направлении не велась в принципе. Сильнейший игрок в го из команды Google играет в силу пятого любительского дана. Это уровень четырёх камней форы с Ли Седолем.

Во всех партиях с Фань программа играла в точку 4-4 (хоси по-японски, starpoint на английском). Кроме нее есть много других возможных начал. Из распространенных: 3-3, 3-4, 5-3, плюс есть разные нестандартные дебюты, где первым ходом играют, к примеру, в центр доски. С точки зрения дебютных новинок, программа не показала ничего нового. В этом отношении она играла очень примитивно.

Дебюты, которые применял Фань, просто были забиты в ее базу. Ничего нестандартного он не использовал. Для меня это остается большим вопросом – как будет действовать программа, если с первых же ходов свернуть с дебютных справочников. На пустой доске вариантов столько, что никаким методом Монте-Карло их не просчитать. В этом го выгодно отличается от шахмат. В шахматах всё давно изучено на глубину 20-30 ходов, а в го, при желании, уже первым ходом можно создать позицию, которая не встречалось в истории профессионального го. Программе придется играть самостоятельно, а не вытаскивать варианты из базы знаний. Посмотрим, сможет ли она это сделать. Я в этом сильно сомневаюсь и ставлю на Ли Седоля.

Кстати, в Санкт-Петербурге летом 2016 года должен состояться Чемпионат Европы по го (EGC), в рамках которого всегда проходит турнир компьютерных программ. «Российская федерация го» пригласила к участию в турнире все сильнейшие программы. Если они примут приглашение, то возможно, именно на этом турнире впервые сыграют между собой программы Google и Facebook. Последняя, в отличие от своего конкурента, идёт честным путем. Бот DarkForest играет тысячи партий на сервере KGS. Сильнейшая версия приближается к шестому дану на сервере. Это очень неплохой уровень. Фань Хуэй и игроки его уровня – это примерно восьмой дан на сервере (из девяти возможных). Разница составляет примерно два камня форы. При такой разнице программа действительно может иногда обыгрывать человека. Если на равных – то примерно в одной партии из десяти.

Максим Подоляк, (Санкт-Петербург), вице-президент «Российской федерации го»:

Мне трудно поверить в то, что крупнейший разработчик ПО приступает к решению сложнейшей, а вообще говоря, неразрешимой, задачи, никак не освещает свою работу, не показывает промежуточные результаты, успешные или нет, и сразу достигает грандиознейшего успеха. Скорее я поверю в то, что Google разработал прекрасный рекламный ход: нашёл не самого сильного игрока с профессиональным статусом и чемпионским титулом, который на некоторых условиях согласится не очень убедительно сыграть. Вот это очень похоже на мир, который я знаю. Простое и понятное решение: никаких рисков, никакого судебного преследования за обман, никаких последствий, только сравнительно небольшой гонорар живому участнику. А плюсы настолько велики, что трудно представить: главный конкурент отправлен в нокаут, весь мир гремит о грандиозном успехе и невиданном прорыве. Google может всё. Даже если позже обман и вскроется, то этого никто не заметит. Да и кто его вскроет? Кто проверит качество теста?

Александр Крайнов (Москва), любитель игры го:

Я, в силу профессиональной деятельности, довольно хорошо знаю ситуацию «с той стороны».

В 2012 году в области машинного обучения в целом произошел качественный скачок. Количество данных для обучения, уровень алгоритмов и мощности для обучения вышли на такой уровень, что искусственные нейронные сети (разработанные как принцип довольно давно) стали давать фантастические результаты.

Принципиальное отличие обучения на нейронных сетях заключается в том, что им не надо давать на вход факторы (в случае го, объяснять, например, какие формы являются хорошими). Им в пределе даже правила можно не объяснять. Главное дать большое количество положительных (ходы выигрышной стороны) и отрицательных (ходы проигравшей стороны) примеров. И сеть научится сама.

Как только алгоритм выходит на высокий уровень игры, программа может играть сама с собой огромное количество партий, обучаясь на результате. Причем не обязательно партии доигрывать. Можно делать так: берётся любая позиция, сеть предсказывает несколько хороших ходов, ходы просчитываются (используя традиционные алгоритмы перебора по дереву решений) насколько возможно, результат добавляется в обучающую выборку.

Я бы не рекомендовал делать ставки на Седоля, ориентируясь на игру программы с Фань.

Мы, грубо говоря, наблюдая за игрой программы, наблюдаем за игрой талантливого четырёхлетнего ребенка. К моменту игры с Седолем в марте он может сильно прибавить. Нейросетевые модели сейчас очень быстро обучаются при достаточном количестве данных. А в случае с го данных очень много. Плюс, как я сказал раньше, их можно генерировать.

Что говорит сам Ли Седоль


Профессиональные игроки го соревнуются не за звание чемпиона мира, а за титулы. Признание и статус мастера определяются количеством титулов, которое он смог получить в течение года. Ли Седоль входит в пятёрку сильнейших игроков го в мире, и в марте этого года ему предстоит побороться с системой AlphaGo.

Сам корейский чемпион предсказывает, что он выиграет со счётом 4-1 или 5-0. Но уже через 2—3 года Google захочет взять реванш, и вот тогда игра с обновлённой версией AlphaGo будет интересней, считает Ли.



Задача создания подобного алгоритма ставит новые вопросы о том, что такое обучение и мышление. Как напоминает М. Емельянов, третья сверху ступень мастерства (пин) по древней китайской классификации называется «полная ясность». Подобный уровень игры предполагает, что решения принимаются интуитивно, практически не считая варианты. Один из сильнейших мастеров XX века Го Сэйгэн говорил, что ему казалось, что он бы выиграл у «го-бога», взяв два или три камня форы. Сэйгэн считал, что почти дошёл до предела понимания игры. Сможет ли нейросеть достичь подобного? Быть может, человеческая интуиция — это заложенный природой алгоритм?

Автор благодарит Александра Динерштейна и паблик go_secrets за комментарии и помощь в оформлении публикации.

Комментарии (60)


  1. vxd_dev
    01.02.2016 16:59

    Го принадлежит к классу игр с совершенной информацией, то есть игроки знают обо всех ходах, которые ранее совершили другие игроки.
    Кто-нибудь умеющий играть, подскажите, пожалуйста, действительно ли игроки запоминают все ходы сделанные за игру? Кажется невероятной способностью.


    1. Nihonjin
      01.02.2016 17:09
      +1

      Да, только в этом нет ничего особенного, любой профессиональный игрок должен уметь восстановить ход игры. У каждого совершенного хода есть своя логика, на ее основе партия и запоминается. Ну и ко всему прочему есть типичные взаимовыгодные розыгрыши, называемые «Дзёсеки».


    1. Northgate
      01.02.2016 17:33
      +5

      Да, это приходит само. Турнирные партии с большим контролем запоминаются довольно просто, т.к. над некоторыми ходами иногда думаешь несколько минут, а потом идет весьма логичное развитие. Хотя, далеко не факт, что партия вспомнится через месяц, но в течении дня восстановить игру вполне возможно, даже для такого не очень сильного игрока как я (1800 очков рейтинга РФГ ~ 1 разряд).
      Сумбурные игры с нетривиальной логикой и блицы запоминаются хуже, но прямо после игры их тоже можно восстановить в памяти, хотя, скажу по себе, не уверен, что до конца смогу вспомнить такую игру, но смогу восстановить больше половины ходов.
      Начинающим иногда рекомендуют учить партии профессионалов, чтобы запомнить основные шаблоны и формы.


      1. tengen
        02.02.2016 14:18

        Сильные игроки помнят все свои партии. И могут их восстановить даже через годы. Даже легкие партии сыгранные вчера за 15 они могут восстановить.


    1. tengen
      02.02.2016 14:25

      А еще есть такая байка. В каком-то лохматом году, один наш чемпион поехал на чемпионат мира среди любителей. От Китая там играл совсем молодой представитель. Партию они не записывали. После игры его попросили записать партию. Так вот он стал ее записывать буквально по строчкам доски слева направо и сверху вниз. Если представить доску, то он писал буквально так: белые-ход134, черные-ход45, черные-ход55 и так далее. Это для нас даже уму не постижимо. А то тут развели: нейросети, нейрости ))


    1. KulikovPavel
      02.02.2016 14:46
      -1

      Мне думается, имеется ввиду просто полная открытость информации по игре.
      Есть поле, есть фишки, все ходы отображены на поле, всё открыто, информация полна и доступна сразу. В Го порядок ходов не важен. Как и в шахматах. Текущее состояние полно.


      1. tengen
        02.02.2016 14:49
        +2

        Порядок ходов не важен? ) Вы только это игрокам в Го не говорите, а то как-то неудобно потом будет перед ними )


        1. KulikovPavel
          02.02.2016 15:04
          +1

          Какое значение для игры на ходу N, с известным текущим состоянием фишек на поле, имеет ход N-1?


          1. Nihonjin
            02.02.2016 15:05

            Без знания предыдущих ходов нельзя предсказать поведение противника. Как и в шахматах.


          1. tengen
            02.02.2016 15:08

            Как бы покороче ответить… Тут надо хотя бы поиграть в Го некоторое время.
            Смотря где этот ход N-1 сделан. То есть это будет уже совсем другая партия.
            Достаточно во время игры выставить камни в том же порядке, но не в той последовательности, и это уже совсем другая партия с другим исходом.


            1. numitus2
              02.02.2016 15:43
              +3

              Видимо вы не знакомы с теорией игр. Для человека — да, порядок важен. Но если мы не пытаемся предсказать действие соперника, на основе предыдущего хода, то порядок не важен.


            1. SSNikolaevich
              02.02.2016 15:57
              +4

              Если подходить формально, то порядок важен только для проверки ограничений связанных с ко/супер-ко. Имея на руках текущее состояние игры, нам необязательно знать, как оно достигнуто. Подавляющее большинство задачек по го имеют вид: дано следующее положение камней, ходят чёрные/белые. Порядок важен с точки зрения получения, удержания инициативы. Но речь в данном случае идёт о планировании будущих ходов, а не о уже сделанных.


          1. Nerevar_soul
            02.02.2016 15:46

            Например ко-борьба. И допустимо ли сейчас его пробить или надо сначала нанести угрозу.


  1. Nerevar_soul
    01.02.2016 17:39
    +2

    gogameguru.com
    Тут можно почитать новости и посмотреть разбор партии профессионалом.
    Так же там есть разборы партий между профи. Таких грубых ошибок как в партии Фана и AlphaGo нет. И часто одна микроскопическая ошибка решает партию. Кто-то захватывает преимущество и не отдает в течении всей последующей игры.(Этим особенно молодые китайцы славятся.)
    Если программа будет играть так же как с Фаном у нее нет ни одного шанса даже партию зацепить у Ли Седоля. Другой овпрос насколько она будет лчше играть к марту.


  1. SSNikolaevich
    01.02.2016 18:16
    +2

    остается большим вопросом – как будет действовать программа, если с первых же ходов свернуть с дебютных справочников.

    Нестандартные варианты дебютов вполне могли присутствовать при обучении сети, например при игре программы с самой собой. Так что на необычное фусеки я бы в подобной игре не полагался, но с удовольствием поглядел бы на поведение программы в такой ситуации. По крайней мере, судя по второй партии с Фанем, AlphaGo вполне может при таком раскладе существенно осложнить позицию и завязать жёсткую борьбу, требующую от человека большого внимания, аккуратности, расчёта и не прощающую ошибок.


    1. Nerevar_soul
      01.02.2016 18:33
      +1

      Ли Седоль вряд ли будет играть что-то уж совсем необычное. Если только поймет что при обычном фусеки шансов выиграть нет т надо пробовать что-то другое.


      1. SSNikolaevich
        02.02.2016 09:08
        +2

        В качестве «чего-то другого» вполне может выступить ко-борьба, кстати, отсутствовавшая в партиях с Фанем.


    1. tengen
      02.02.2016 14:54

      Да какую борьбу? ) То что было представлено в партиях с Фаном, там даже намека нет на борьбу. Самое сложное в партиях — это ко-борьба. А Ли Седоль очень силен в ко-борьбе. Можно сказать, что он один из лучших по этой части. Очень сложно оценить последствия ко-борьбы на профессиональном уровне. Не все профессионалы это могут.


  1. Halt
    01.02.2016 18:42
    +3

    За статью спасибо, но вы бы терминологию причесали. А то от «игр с совершенной информацией» и «свертовых сетей» плакать хочется.


    1. PashaPodolsky
      02.02.2016 05:43
      +1

      «Игра с совершенной информацией» вроде бы вполне устоявшийся термин из теории игр.


      1. Halt
        02.02.2016 07:19
        +1

        Насколько я помню, всегда говорили об играх с «полной» и «неполной» информацией. Поправьте меня пожалуйста, если я не прав.


        1. PashaPodolsky
          02.02.2016 10:00
          +2

          Да, это правильное деление. Но игры с полной информацией дальше делятся на игры с совершенной и несовершенной информацией. Полная информация – знание правил игры и функций выигрыша всех игроков; совершенная информация – знание ещё и всех предыдущих ходов противника, или, иными словами, истории игры.


          1. Halt
            02.02.2016 11:36

            Спасибо за информацию, теперь понятно.


    1. atomlib
      02.02.2016 05:44
      +1

      «Свёртовые» исправил, спасибо.


  1. ansector13
    01.02.2016 18:46

    Прошу интересующихся подсказать, а какая сейчас ситуация в шахматах?
    На каком уровне играют лучшие программы? Есть ли турнииры против человека?


    1. Rom77
      01.02.2016 18:54
      +1

      Посмотрите здесь и здесь.
      А если в двух словах, то компьютеры в шахматах сейчас намного сильнее людей.


    1. Tohuchar
      01.02.2016 19:09
      +1

      Турниров людей и компьютеров нет: у людей шансы минимальные. Рейтинг чемпиона мира Карлсена — 2844, 45 человек имеют 2700 и выше (звание гроссмейстера могут присвоить при не менее 2500), а лучшие шахматные движки оцениваются на 3200-3350.


    1. knstqq
      01.02.2016 20:16
      +2

      «В 1996 году компьютер впервые выиграл в шахматы у чемпиона, а с 2005 года ни один чемпион уже не в состоянии выиграть у компьютера.»
      Сейчас шахматисты используют компьютерные шахматы для анализа партий и тд


    1. Randl
      01.02.2016 21:06
      +1

      Человек может играть с компьютером только с форой. Даже топам программа не проигрывает без пешки.


  1. Arxitektor
    01.02.2016 20:16

    Программа от google чисто программная разработка. Т.е. её можно скопировать?
    Как сильно возрастут её возможности ести увеличить производительность железа на 1-2 порядка.
    Предположим запустить на 1 из топ 5 супер компьютеров предварительно оптимизировав?
    Вопрос по нейросетям:
    Если взять 1 программу и скопировать её, сделать 4 копии и заставить из играть друг с другом то через 10000 игр они перестанут быть идентичными? и как сильно они изменяться?
    И будут ли отличаться 2 идентичные нейросети обученные на одинаковой выборке изображений если перед обучение они были идентичны?


    1. Danco
      02.02.2016 14:43

      Если взять 1 программу и скопировать её, сделать 4 копии и заставить из играть друг с другом то через 10000 игр они перестанут быть идентичными?
      Зависит от метода обучения (см. ответ на второй вопрос ниже).
      Чтобы были точно разные, лучше заставлять их попарно играть друг с другом по N партий, а потом менять пары и снова играть, пока каждая не сыграет «10000 игр».

      И будут ли отличаться 2 идентичные нейросети обученные на одинаковой выборке изображений если перед обучение они были идентичны?
      Зависит от метода обучения (оценки параметров) -> инициализация начальных параметров, глобальная (не)сходимость метода, кол-во итераций.
      Данная НС, считаю, что не будет различаться. Чтобы были разные, нужно на разных наборах данных обучать.


  1. Randl
    01.02.2016 21:01
    +2

    В статье не указано, что играла распределенная версия (1202 CPU и 176 GPU). Кроме того, было еще 5 партий с более коротким контролем, из которых 2 выиграл человек (в отличии от шахмат, где чем короче контроль, тем выше преимущество (и так огромное) машины над человеком). Если с Седолем будут играть с контролем 4-6 часов, то это усилит программу.

    Кроме того, у топовой программы Crazy Stone нераспределенная версия выиграла 77% игр с гандикапом в 4 камня, то есть усиление огромное. Так что в теории заговора я не верю.


    1. atomlib
      02.02.2016 05:46

      Всё, что вы перечислили, в статье есть:

      Против распределённой версии AlphaGo сразился профессиональный игрок 2 дана, победитель Чемпионата Европы по го в 2013, 2014 и 2015 года Фань Хуэй.
      Именно эти игры стали поводом к заявлению, что компьютер впервые смог обыграть профессионального игрока в го. Кроме 5 официальных партий были проведены 5 неофициальных, которые не шли в зачёт. Две из них Фань выиграл.
      Также неясны выбранные правила: час на партию вместо нескольких часов серьёзных игр. Впрочем, формат выбирал сам Хуэй.
      Но даже с 4 камнями форы одномашинная AlphaGo выигрывала в 77 %, 86 % и 99 % случаев против Crazy Stone, Zen и Pachi, соответственно.


      1. Randl
        02.02.2016 12:22

        Дьявол как всегда, в деталях: количество CPU дает примерное представление о вычислительной мощности соперника Фань Хуэйа. Про неофициальные партии важно то, что контроль был короче, что позволяет предположить, что на турнирном контроле AlphaGo будет ещё сильнее.

        Но признаю, что статью читал по диагонали, потому что это уже четвертая статья на эту тему (пожалуй самая подробная). Так что некоторые вещи я и правда просто не заметил.


    1. Nerevar_soul
      02.02.2016 12:08

      А гле можно посмотреть партии против других программ? Тот же zen например играет на KGS и кстати недавно в блице(10 секунд на ход) обыграл Павла Лисего — европейского про.
      Фань играл очень слабо даже для своего уровня. ОН допускал очень грубые ошибки и не наказывал Альфу за грубые ошибки. Следствие чего это — денег, плохой формы или еще чего каждый решает сам.
      Программа использовала меньше времени чем Фань, насколько я знаю, так что больший контроль скорее на руку человеку. Другой вопрос, что есть мнение что не для про больше полутора часов времени просто не нужно, так как оно будет просто лишним. А вот про намного более полезно расходуют время.(Я не считаю Фаня про по силе игры, так как он уже давно не играет в про турнирах постоянно и намного больше играет с европейскими любителями, что не могло сказаться на его уровне.)


  1. Vaxx
    02.02.2016 07:44
    +1

    В шахматы давно играю на сайтах www.iccf.com и www.bestlogic.ru

    Давно хочу попробовать играть в ГО. Подскажите пожалуйста:
    — на каких сайтах можно = лучше начать играть в ГО?
    — какие программы можно использовать для игры в ГО с движком = программой?


    1. Hamper
      02.02.2016 08:32

      Один из самых популярных сайтов в России это www.gokgs.com. На нем некоторые клубы проводят семинары, можно договориться об обучающих партиях, поиграть с ботами, посмотреть за чужими играми, удобно проводить разборы партий. Из ботов для начала неплохо пойдет что нибудь на основе движка GnuGo. На том же kgs можно поиграть с ботами с рейтингами 30-25кю, а потом и дальше если будет слишком легко (рейтинги на этом сервере начинаются с 30кю для новичков до 1кю, потом начиная с 1 дана и вверх). Разница в 1кю примерно соответствует одному камню форы (если играть черными) или 7-8 очкам коми (для белых).


      1. Hamper
        02.02.2016 08:40

        P.s.: видимо, все же, не стоит с аккаунтом r&c делать первые комментарии в теме с недосыпа, потому что можно наделать кучу явных грамматических ошибок, с невозможностью их исправить, хотя я их и заметил почти сразу.


      1. Barafu
        02.02.2016 09:58

        Поиграть против программы можно очень хорошо на планшете — под Андроид очень много вариантов уже есть.


        1. GlukKazan
          02.02.2016 14:22

          Гораздо лучше играть с людьми. И для новичка с обязательным разбором партий.


    1. Singerofthefall
      02.02.2016 10:02
      +1

      online-go.com/play — не нужны ни флеш ни java
      pandanet-igs.com/communities/pandanet — есть клиенты под Android/Ios

      Рейтинги на этих сайтах работают почти так же как на kgs, то есть два игрока с одинаковым рейтингом на разных сайтах играют примерно в одну силу (ну может плюс-минус кю). Игрой с ботами лучше особо не увлекайтесь, особенно поначалу, они играют довольно шаблонно.

      Еще до кучи:

      playgo.to/iwtg/en — объяснение правил для людей, которые никогда не играли в го, с интерактивными примерами
      senseis.xmp.net — обо всем
      www.goproblems.com — задачи


    1. Nerevar_soul
      02.02.2016 11:59
      +1

      Новичкам лучше не играт с ботами. Из-за того, что слабые боты очень сильно тупят и делают очень глупые ходы, которые не делает даже человек такого же уровня, можно криво обучиться. Зато они правда считают хорошо локальные ситуации.


  1. Vaxx
    02.02.2016 08:38

    Спасибо, попробую.
    В шахматах уже прошел чемпионат мира между командами шахматных серверов.
    www.chess-server.net/uploads/wccstc/index.html


  1. netto
    02.02.2016 11:44
    +2

    > В случае победы человека его получит Ли Седоль, в случае победы алгоритма он уйдёт на благотворительность.

    Думаю, если бы мы могли поинтересоваться в этом вопросе мнением самого AlphaGo, то он бы выбрал купить на него себе еще процессоров ;)


  1. Nerevar_soul
    02.02.2016 17:11

    Кстати занимая углы АльфаГо только в одном случае из 10 занаяла не пункт 4-4. Считается что при розыгрыше с этими пунктами позиция более проще. Интересно программа сама выбирает эти пункты для начала пратии или это выбор людей.