Будет ли Кэ Цзе выглядеть таким же довольным после игры с компьютером?
В марте этого года один из лучших игроков мира в го Ли Седоль провел несколько игр с AlphaGo, системой компьютерного го. Эта система состоит, грубо говоря, из комбинации метода Монте-Карло и нейросетей политики (policy networks) и ценности (value networks). Для того, чтобы выйти на текущий уровень мастерства, AlphaGo играла в го сотни тысяч раз (речь идет примерно о 160 тысячах уже сыгранных партий). Сами партии брались с сервера KGS, где играют мастера от шестого до девятого дана. Система самообучалась, причем во многом — благодаря оригинальной системе обучения с подкреплением. Первая сеть политики играла с людьми, вторая — играла с первой, оптимизируя ее. Это делалось для того, чтобы система стремилась выиграть, а не просто предсказывать ходы. И такая система вполне себя оправдала.
Дело в том, что го — это игра с огромным числом возможных позиций камней на стандартной доске. Таких позиций примерно в гугол (10100) раз больше, чем в шахматах. Это даже больше, чем число атомов во всей Вселенной. Именно поэтому го считалась игрой, обучить которой искусственный интеллект очень сложно, если вообще возможно. Но, как видим, вполне возможно. А на первый взгляд все очень просто = на доске 19*19 линий игроки располагают камни двух цветов, и начинают попытки занять камнями своего цвета площадь больше, чем соперник. Надо сказать, что до AlphaGo были и другие программы — но они играли на уровне любителя, а не мастера, тем более, 9 дана. Но AlphaGo удалось победить чемпиона Европы, а также одного из пяти сильнейших игроков мира Ли Седоля.
Надо сказать, что Седоль действительно сильный игрок, который получил первый профессиональный дан в 1996 году, когда ему было всего 13 лет. Ему принадлежит уже 18 различных титулов международного значения. Естественно, видя первые попытки AlphaGo играть с людьми, Седоль решил, что система играет довольно слабо. И он довольно быстро согласился поучаствовать в серии игр с AlphaGo. Изначально Седоль утверждал, что без проблем выиграет у компьютерной системы со счетом 4:1 или даже 5:0. Но ситуация вышла из-под его контроля, выигрывать начал как раз компьютер. По итогам всех пяти игр победителем вышла система AlphaGo. Если бы Ли Седоль выиграл бы у AlphaGo, он бы получил миллионов долларов США. Но он проиграл, и миллион призового фонда ушел на благотворительность. Призовой фонд проигравшему составил 170 тысяч долларов. Из них 150 тысяч — за участие, и 20 тысяч — за победу.
Игра 1
Чёрные: Ли Седоль
Белые: AlphaGo
Результат: Ли Седоль признал поражение
Ходов: 186
Игра 2
Чёрные: AlphaGo
Белые: Ли Седоль
Результат: Ли Седоль признал поражение
Ходов: 211
Игра 3
Чёрные: Ли Седоль
Белые: AlphaGo
Результат: Ли Седоль признал поражение
Ходов: 176
Игра 4
Чёрные: AlphaGo
Белые: Ли Седоль
Результат: AlphaGo признала поражение
Ходов: 180
Игра 5
Чёрные: Ли Седоль
Белые: AlphaGo
Результат: Ли Седоль признал поражение
Ходов: 280
Что теперь?
Таким образом, Ли Седоль выиграл только один раз. После серии побед AlphaGO получила почетный девятый профессиональный дан от «Корейской ассоциации падук». И сейчас компьютерный игрок высшего уровня может сыграть с китайским чемпионом, мастером го девятого дана Ке Цзе. Он, к слову, несколько раз победил Ли Седоля. Ке Цзе — гений в мире го, и он утверждает, что вероятность его выигрыша у AlphaGo составляет около 60%. Вероятно, Цзе знает, что говорит. Судите сами.
Он начал учиться играть в го в возрасте 5 лет, его учителем был Чжоу Цзунцян (???). В 2007 впервые выиграл в Национальном чемпионате. В 2008 году получил разряд 1 профессионального дана, а в 2015 — 9 дан. В январе 2015 завоевал свой первый международный титул чемпиона мира во втором Bailing Cup, победив Цю Цзюнь. С этой победой Кэ Цзе стал самым молодым действующим чемпионом мира.
В декабре 2015 разгромил Ши Юэ (Shi Yue) и стал победителем 20-го кубка Samsung. Таким образом, он является обладателем двух крупных международных титулов, полученных за один год, впервые с 2011 года, когда аналогичный результат показал Ли Седоль.
Третий международный титул Кэ Цзе получил в январе 2016 победой во 2-ом Meng Baihe Cup, взяв верх над прославленным южно-корейским игроком в го Ли Седолем. Хотя разрыв по очкам у соперников был минимальный, и при использовании другой системы подсчета очков выиграл бы Ли. Этот титул делает его четвёртым китайским профессиональным игроком в го, выигравшим три международных титула, наряду с Гу Ли, Кун Цзе, Чан Хао. В марте 2016 он еще раз встретился с Ли на 17-ом Nongshim Cup и также выиграл у него со счетом 7-2.
Цзе собирается сыграть с AlphaGo в октябре этого года, в Китае, провинция Хайнань. Соответствующая информация появилась в официальном фан-клубе Цзе в китайском аналоге Twitter, Sina Weibo.
Интересно, что сразу после игры с Седолем AlphaGo набрала 3533 очков, что позволило системе занять четвертое место в общемировом рейтинге игроков го. С тех пор компьютерная система поднялась еще выше, заняв второе место. Первое место сейчас занимает Кэ Цзе. Если компьютер выиграет — чемпионом мира станет машина. Если до матча с Седолем специалисты спорили в плане того, если у машины шанс победить человека, то теперь можно не спорить. Вероятность победы компьютера довольно велика.
Текущий рейтинг мастеров го с 1 по 25 место
Rank | Name | >+ | Flag | Elo |
---|---|---|---|---|
1 | Ke Jie | > | 3625 | |
2 | Google DeepMind AlphaGo | 3605 | ||
3 | Park Junghwan | > | 3586 | |
4 | Lee Sedol | > | 3545 | |
5 | Shi Yue | > | 3529 | |
6 | Mi Yuting | > | 3526 | |
7 | Iyama Yuta | > | 3523 | |
8 | Park Yeonghun | > | 3507 | |
9 | Lian Xiao | > | 3505 | |
10 | Tuo Jiaxi | > | 3502 | |
11 | Kim Jiseok | > | 3502 | |
12 | Gu Zihao | > | 3488 | |
13 | Chen Yaoye | > | 3482 | |
14 | Zhou Ruiyang | > | 3477 | |
15 | Wang Xi | > | 3468 | |
16 | Kang Dongyun | > | 3467 | |
17 | Tang Weixing | > | 3458 | |
18 | Li Qincheng | > | 3457 | |
19 | Jiang Weijie | > | 3455 | |
20 | Huang Yunsong | > | 3454 | |
21 | Shin Jinseo | > | 3448 | |
22 | Gu Li | > | 3445 | |
23 | Peng Liyao | > | 3444 | |
24 | Hong Seongji | > | 3439 | |
25 | Lee Donghoon | > | 3437 |
Только зарегистрированные пользователи могут участвовать в опросе. Войдите, пожалуйста.
Комментарии (46)
nikitastaf1996
06.06.2016 16:53+3До октября еще есть время.Можно потренироваться :)
yea
06.06.2016 17:11+9До октября еще есть время
Это-то и пугает. На играх с Седолем все увидели, что AlphaGo развивается сумасшедшими темпами — результаты, которые она показывала осенью прошлого года, были на порядок хуже, чем новые. Так что вполне вероятно, что к осени AlphaGo будет уже недостижима для мясных человеков — если продолжит прокачиваться теми же темпами, конечно.solariserj
07.06.2016 11:12+1Ну как бы до Ли Седоля из профессиональных игроков никто не верил в AlphaGo серьезно, и вот Седоль пришел на расслабоне и увидел как у него утянули победу за победой, потом напрягся, но так и не смог вытянуть. К этой игре будут уже готовится основательней(правда не знаю как идет подготовка), но то что подойдут к игре серьезно это, да.
Но если честно осталось 2-3 года и AlphaGo будет уверенно выигрывать у любого человека, и через 5-7 лет даже на 9 камнях форы.
igruh
06.06.2016 17:21+1Представляется немного странным, что после одной серии игр с одним человеком рейтинг системы стал столь высоким. Обычно рейтинги учитывают результаты за довольно большой период времени.
AlAnSa
06.06.2016 19:18А где сказано, что AlphaGo получила рейтинг только за одну серию игр? Судя по тексту — как раз наоборот:
сразу после игры с Седолем AlphaGo набрала 3533 очков, что позволило системе занять четвертое место в общемировом рейтинге игроков го. С тех пор компьютерная система поднялась еще выше, заняв второе место.igruh
06.06.2016 22:05+1сразу после
AlAnSa
06.06.2016 22:17+1И что? А с чего вы решили, что ее рейтинг начал считаться сразу перед игрой? На каком она УЖЕ была месте? Так то она и до Седоля играла.
Mad__Max
06.06.2016 22:35+1Это была не 1я ее официальная игра. Она с осени прошлого года несколько раз с живыми соперниками играла, еще до серии игр с Седолем. В т.ч. "в сухую" обыграла чемпиона Европы по го: https://geektimes.ru/post/269990/
nkie
06.06.2016 17:41+1Учитывая что сеть специально будут натаскивать на играх Кэ Цзе, ему для победы нужно будет полностью изменить свою привычную стратегию. В этом случае у него будет возможность победить.
dom1n1k
06.06.2016 21:08+1Вот в этом и несправедливость. Машину можно сутками натаскивать на борьбу с конкретным человеком, который не может быстро измениться. А в алгоритмах постоянно тюнят какие-то параметры, от которых поведение может серьезно меняться, поэтому изучать прежние партии AlphaGo может быть неэффективно.
Lure
06.06.2016 21:33+1Не факт, это же игра с полной информацией. Вдруг у него и так стратегия близка к оптимальной. А программа сможет найти какие-то слабые места, и тогда он ещё и усилит собственный уровень по результатам проигрышей. А лезть в какое-то болото незнакомых ему самому вариантов не особо полезно, выше шанс, что он там накосячит.
Вот в игре с неполной информацией другое дело. Если программа натаскана на игрока в покер по его раздачам с открытыми картами, то правильно будет сменить многое. Например — если блефуешь очень часто на досках определённого вида — надо перестать это делать. Любое своё привычное отклонение от GTO надо обратить — поначалу будет плюс, пока программа не подстроится. Далее, если ты очень силён — стараться играть GTO. В теории, это даст небольшой, но перевес над «заточенной» программой.naneri
07.06.2016 23:08В этом плане будет интересно посмотреть когда гугл возьмётся за ИИ играющий в старкрафт.
Sychuan
07.06.2016 00:25+1Вроде как всегда говорили, что ее не учат на специальных играх. Т.е. АльфаГо сыграла миллионы или миллиарды игр, на играх какого-то конкретного человека она ни чему не научится
roboq6
08.06.2016 11:11Так в том-то и дело, что сеть ни на кого не натаскивают. В интервью создатели AlphaGo прямо говорили что AlphaGo никто не тренировал конкретно против Ли Седоля.
Tanyku
06.06.2016 18:02-1Кто-нибудь использовал нейросеть, чтобы обрабатывать теоремы и гипотезы (доказывая или опровергая их) или этого они ещё не умеют?
Или игра в го способствует этому?Bytamine
06.06.2016 18:49+3Сейчас игра в го способствует только игре в го.
Tanyku
07.06.2016 09:53+1Тогда почему не дать нейросети обрабатывать теоремы? Дать ей данные по физики/химии, например.
Сначала учить её доказывать уже доказанное человеком, потом дать анализировать и вычислять то, что нам неизвестно.nikitastaf1996
07.06.2016 10:05+1https://habrahabr.ru/post/183374/
Tanyku
07.06.2016 10:35+1поясните
lo0p3r
07.06.2016 11:04+1Вдогонку — geektimes.ru/post/276468
Мало получить само доказательство. Его нужно понять и проверить. А сделать это, скорее всего, весьма затруднительно.Tanyku
07.06.2016 11:20+1Интеллект — это инструмент, который даёт способности познавать, обучаться, мыслить логически, систематизировать информацию путём её анализа, определять её применимость (классифицировать), находить в ней связи, закономерности и отличия, ассоциировать её с подобной и т. д
Искусственный интеллект — это наш помощник, который должен помогать в получении знаний, проверках, анализе, выводах и тд.
С помощью него мы и должны выходить из таких тупиков, как в статьях.
Если наш интеллект способен самостоятельно справляться с этим, то зачем нам ИИ?Bytamine
07.06.2016 12:52+1В словосочетании «искусственный интеллект» в настоящий момент правдиво только первое слово. Интеллектом ИИ не является. Но если рассматривать его, как черный ящик, то для внешнего наблюдателя в некоторых условиях может казаться, что таки да.
Necrozyablo
06.06.2016 19:54+1Однако, есть проблема. Кэ Цзе в последнее время не в лучшей форме.
bazilxp
06.06.2016 19:59Ли Седоль выиграл одну только партию из 5… В одной шансы были хорошие компьютер нашел мерзкий ход… Тут дело не в форме, этот кластер имеет очень сильный уровень игры=) з.ы. я сопереживал за Ли Седоля…
Necrozyablo
06.06.2016 21:09+1Ну просто тот же Ли заявляет, что выиграет у «Го Бога» на 2 камнях форы. Т.е. по его мнению предел мастерства близок.
А Кэ Цзе впоследнее время слил несколько важных партий. И не факт что он прямо сейчас топ1.
Я был бы рад увидить игру сразу с несколькими про. Потому как далеко не факт что Ли был в лучшей форме.
К слову фусеки, которые применял АльфаГо уже несколько раз играли в про играх. И во всех они не сработали.bazilxp
06.06.2016 21:25я бы тоже рад был увидеть игру например против Такемии Масаки=)
Строитель больших Мое=)
themtrx
06.06.2016 22:46+2Буду болеть за Скайнет.
Интересно, где-то есть тотализатор? Поставил бы биткоин-другой на своего фаворита.
RomanVZ
06.06.2016 23:05+1Игра Го придумана мудро: если один противник сильнее другого, более слабому дается фора до 9 камней. Причем есть варианты правил, когда эти камни можно ставить не только в «стандартные» позиции на доске. Так что о том, что компьютер полностью обыграет человека, можно будет говорить лишь тогда, когда у человека будет фора в максимальные 9 камней.
WinDigo
07.06.2016 11:38+1К сожалению, судя по всему, пока что это всего лишь слухи. В самом источнике из статьи используются фразы «Очень вероятно, что...» и «Ке Цзе надеется сыграть в октябре...». Более того, там же говорится, что «Демис Хассабис проявил желание пригласить Ке сыграть с АльфаГо, но пока что от него нет никаких признаков возможности этого матча в октябре». Т.к. Демис в данном случае является представителем АльфаГо, это важный нюанс.
Наиболее серьёзным аргументом того, что это слух, является твит самого Хассабиса: twitter.com/demishassabis/status/739832323160563712. В нём говорится о том, что «Вопреки слухам в интернете мы пока ещё не решили, что делать дальше с АльфаГо. Как только определимся, здесь появится официальное объявление».
Animan
07.06.2016 14:27+1Как однажды резонно замечали — ограничивать надо не время на ход, а энергозатраты на ход. Мозг тратит сильно меньше чем кластер вычислительный. Будет честнее.
Fen1kz
07.06.2016 14:36AlphaGo нужен не для выигрыша в Го, а для развития ИИ, а стало быть нужно выжимать из него максимальные мощности, не беспокоясь о размерах/энергозатратах, ибо по мощности ИИ пока отстает
Animan
07.06.2016 15:57+1Но данный ИИ будет только уметь играть в Го. Метод вполне показал эффективность такого обучения и подхода. К чему тогда эти показательные матчи вообще?)
JediPhilosopher
07.06.2016 19:39+2Очевидно чтобы привлечь внимание общественности. А где внимание — там деньги, реклама и новые люди, готовые этим заниматься.
Это как с космосом. С практической точки зрения важен не флаг, воткнутый на Луне, а куча всяких технологий открытых в процессе. Но вот открыть их могли только при наличии денег и людей. Которых привлекла амбициозная цель по втыканию флага, а не изобретение какого-нибудь жаропрочного покрытия, нужного и поленого но скучного.
Zhrun
07.06.2016 17:39+1Зачем в последней таблице третий столбец? Только для того, что бы показать, что АльфаГо не мужчина?
Fen1kz
Посмотрим, опровергнет ли AlphaGo расхожую фразу «Что бы ты не делал, всегда найдется азиат, который сделает это лучше»
eugenius_nsk
Интересно, участвовали ли азиаты в создании AlphaGo? Если да, то не опровергнет, а подтвердит.
nonrblGyN4ik
Достаточно чтобы нейросеть AlphaGo обучалась азиатами… Мыслить как азиат и всё такое:)
Mad__Max
Смотря что значит под "обучалась". Для обучения использовались записи игр сильнейших игроков планеты. А поскольку практически все сильнейшие игроки в ГО — азиаты, то получается AlphaGo училась "играть как азиат", перенимая их стиль/стратегии/фирменные ходы и т.д. независимо от того, кто ее изначально программировал.