Прошлые три игры исторического матча выиграл ИИ
Огромный плюс победы человека: мы увидели, как в интерфейсе AlphaGo выглядит признание поражения.
Сегодня прошла четвёртая партия матча Ли Седоль — AlphaGo. Играют известный 33-летний обладатель девятого профессионального дана и система компьютерного го от подразделения DeepMind компании Google. Сегодня Седоль выиграл.
AlphaGo — продукт от DeepMind, который комбинирует метод Монте-Карло с нейросетями политики и ценности. Играющая в Сеуле система является результатом двух лет работы, в том числе машинного обучения нейросетей на 160 тысячах партий с сервера KGS и в играх против самой себя. В прошлом октябре AlphaGo уже выигрывала у сильного игрока. Это был трехкратный европейский чемпион Фань Хуэй, который проиграл искусственному интеллекту в пяти из пяти партий.
Считается, что в Европе уровень владения го ниже, чем на родине игры, в Азии. Показать явное превосходство должен матч против Ли Седоля. Профессионал уже проиграл в трёх играх из пяти. Теперь ясен и исход серии, и судьба призового миллиона долларов — он уйдёт на благотворительность и организациям по развитию го. В последних двух партиях определится глубина поражения команды людей.
Вчера, после третьего поражения человека, одной из тем пресс-конференции был вопрос, есть ли у AlphaGo слабые места. Седоль упомянул, как чувствовал, что они есть. Он извинился перед корейской нацией и сообществом игроков го за показанный результат.
Легко понять его напряжение. Го — популярная в Корее игра, по некоторым оценкам в неё играют около 8 миллионов человек. В Южной Корее новости о матче выходят на первые полосы газет. Серьёзность происходящего для Google показывают фигуры наблюдателей. Игры посещают бывший глава Google Эрик Шмидт, сооснователь поискового гиганта Сергей Брин и один из важных инженеров компании Джефф Дин. Последний помогал Google прокладывать оптический канал в отель Four Seasons, в котором проходит матч. Канал нужен для связи с дата-центрами компании, где на сотнях процессорных ядер и видеоускорителей запускается AlphaGo.
Человек играл белыми, то есть у ИИ было преимущество в виде хода первым. Как и в предыдущих играх, Седоль исчерпал время раньше оппонента. То есть в какой-то момент человек был вынужден тратить всего по минуте на ход. В свою очередь система AlphaGo хорошо распоряжалась временем — это результат добавления нейросети, которая помогает управлять им.
78 ход белых оказался отличным. Возможно, Седоль действительно нащупал слабое место компьютерной системы. AlphaGo ответила слабо. Как пишет глава DeepMind Демис Хассабис, на 79 ходу система допустила ошибку, но поняла это только на 87 ходу. После этого ИИ запутался.
Mistake was on move 79, but #AlphaGo only came to that realisation on around move 87
— Demis Hassabis (@demishassabis) 13 марта 2016 г.
AlphaGo начала делать откровенно слабые и ужасные ходы. Система признаёт поражение, когда оценка шанса победы падает ниже 20 процентов. Об этом инженер Google Дэвид Сильвер напомнил во время перерыва, который взял Ли Седоль. Сильвер отказался комментировать серию невнятных ходов системы. Игра продолжилась, и Седоль всё так же был вынужден работать в условиях недостатка времени. ИИ допустил ещё один промах, а чуть позже признал поражение. Результатом противостояния на 4,5 часа и 180 ходов стала победа человека. Седоль заявил, что его никогда не поздравляли так сильно за всего лишь один выигрыш.
Игр будет проведено пять, и счёт 3-1 уже поставил точку в вопросе о победителе. Но для оценки силы системы важен общий результат матча. Последняя, пятая партия пройдёт во вторник. Как и прошлые четыре, она будет транслироваться на канале DeepMind на YouTube. Интересно, что в октябре Фань Хуэй тоже выигрывал у AlphaGo. Европейский чемпион одержал победу два раза, но в неформальных играх.
Го — древняя восточноазиатская логическая игра. Каждому из двух игроков нужно отгородить камнями своего цвета территорию как можно большего размера. Исследователей искусственного интеллекта в го привлекает сложность: позиций слишком много, чтобы перебрать их. Компьютерные системы давно подчинили себе и шашки, и шахматы. К примеру, с 2005 года лучшие из людей проигрывают лучшим из компьютерных систем по игре в шахматы. Системы компьютерного го есть, но играют они на уровне любителей. До появления AlphaGo эксперты считали, что игра го останется неприступной ещё десяток лет.
Ходы четвёртой игры
Комментарии (132)
idziev
13.03.2016 13:26+15Всё-таки молодец мистер Ли, после трёх поражений он был разбит и подавлен. А сегодня прям сиял. Не стоило недооценивать противника. Возможно, не проиграй он первую игру, результат серии был бы другим.
valemak
13.03.2016 13:26Честь Ли Седоля спасена.
Послематчевого харакири не будет.
Впервые наблюдал за партией от начала и до конца. Седоль сегодня активно угрожал во всех углах доски (в троих из них отвоевал заметную территорию), возможно, нейросеть ниасилила агрессивную игру сразу на 4 фронтах.
Halt
13.03.2016 18:13+3Седоль выиграл благодаря блестящей комбинации в центре доски, когда смог вторгнуться и удержать группу внутри мойо противника. До этого момента можно было сказать, что Ли капитально проигрывал. Ну а потом программа начала гнать откровенную лажу.
ankh1989
14.03.2016 07:40+2Там, судя по всему, проявило себя отсутствие решалки тсумего, что довольно странно, потому что в предыдущей игре Ли замутил очень заковыристую тсумегу в углу зависящую от хитрой последовательности ко, но АльфаГо даже не напрягся.
nikolaynag
13.03.2016 13:35+10Интересно, насколько тут важен фактор адаптации человека к игре с конкретной компьютерной системой? Он ведь натренирован играть с другими людьми. Может преимущество человека как раз заключается в том, что он может уже на трёх партиях чему-то новому научиться, а AlphaGo для этого нужно тысячи партий?
lexore
13.03.2016 16:35+1Мне кажется, фактор адаптации очень важен. AlphaGo проанализировала тысячи игр людей. Не думаю, что Ли Седоль имел возможность проанализировать массу игр этой системы. Это подтвердится, если он найдет слабину и сможет ей постоянно пользоваться.
Halt
13.03.2016 18:16+1Адаптация под людей — это только первый этап обучения системы. Как говорят сами разработчики, основную работу она провела, играя сама с собой.
Насколько я понял, в будущем планируется организовать обучение вообще без человеческих партий. Тогда воможно мы увидем что-то новое. Хотя и в прошедших партиях, программа демонстрировала творческое мышление и делала оригинальные ходы.lexore
13.03.2016 18:18+3Я имел в виду, а адаптировался ли Ли Седоль на работу программой?) Поиск и знание слабостей в стратегии соперника — важная составляющая в поединке.
Hellsy22
14.03.2016 08:43+2основную работу она провела, играя сама с собой.
И это минус. При такой игре некоторые ошибки лишь накапливаются.
ivansychev
13.03.2016 13:46+9Я верил! Я верил в него!
Ждём пятую партию. Будет очень интересно, если Седоль повторит успех четвёртой.
Jamdaze
13.03.2016 13:50Не слишком рано называть этот матч историческим?
atomlib
13.03.2016 13:53+14Вряд ли рано. Многие издания сравнивают этот матч с матчем между Deep Blue и Каспаровым. Были разве другие случаи такого масштаба, когда чемпиона го три раза подряд обыгрывала компьютерная система?
stranger777
15.03.2016 15:13+2Седоль не чемпион, увы и ах, хотя сильный профессионал. Пятый в Корейском рейтинге:
http://english.baduk.or.kr/sub03_02.htm?menu=f13&divL=2
valemak
13.03.2016 13:59+2Нет. Ещё за день до матча большинство было уверено что ИИ не ровня человеку в го, и, может быть. через пару-тройку лет, когда разработчики проанализируют ожидаемое поражение AlphaGo в матче и улучшат игру, компьютерная система сможет показывать что-то интересное.
Матч показал что всё, в плане го ИИ как минимум играет на уровне профи экстра-класса. И уже мало у кого сомнений, что в ближайшем будущем люди не будут иметь шансов против суперкомпьютера и в этой игре.
Шахматы пали лет 10 назад, фактически теперь настал черёд го, считающейся гораздо более сложной в плане программирования стратегии.Halt
13.03.2016 18:18+3Я бы еще добавил, что этот матч — фактически первая игра программы с серьезным соперником (и уже такой результат!). Можно только догадываться, что будет в будущем.
prospero78su
14.03.2016 11:00+1> Нет. Ещё за день до матча большинство было уверено что ИИ не ровня человеку в го, и, может быть. через пару-тройку лет,…
)) Обожаю такие повороты.
Между прочим, это отличная ситуация того, как люди могут прогнозировать последствия своих действий.
И как люди оценивают потенциал подобных систем.valemak
14.03.2016 12:11Тут ещё психологический момент. Оптимистично оценивать возможности ИИ = признавать, что люди теряют свои позиции и недалеко то время, когда киберсущества будут нас превосходить во всём. Осознание что мы "устареваем" неприятно, и людишки склонны думать что у них ещё есть порох в пороховницах.
prospero78su
15.03.2016 09:08Не знаю. Лично я не вижу в этом проблему.
Сделай мне операцию, тыжеврач! (терапевт)
Сделай компьютер, тыжекомпьютерщик (программист, сгорел монитор)
Построй дом, тыжстроитель (инженер по расчёту домовых сетей)
И в таком духе. Люди привыкнут. В-целом, хорошо, что люди боятся — будут идти осторожно. Хотя, на самом деле большинству пофигу — ведроид это один сплошной зонд. Кого это заботит по настоящему? )))
Welran
14.03.2016 06:38+2Как раз самое время. Это первый и неожиданный матч в котором была серьёзная борьба. Дальше пойдёт рутина когда люди будут все чаще проигрывать и в конце концов просто не останется шансов на победу.
Barafu
13.03.2016 13:54-2Сейчас пойдут слухи, что у AlphaGo «скрутили» умение, чтобы уж совсем не позорить игрока.
valemak
13.03.2016 14:25+6Такие слухи будут циркулировать в любом случае. Впрочем Google подозревать в переживаниях за репутацию Седоля оснований нет. Счёт 5-0 был бы наиболее предпочтителен для корпорации добра (в плане демонстрации прорывного успеха в области разработки ИИ).
Хассабис после игры слегка нервничал — несколько минут мял какую-то бумажечку-шпаргалку, то сворачивал то разворачивал её. Всё-таки разочарован тем, что его детище не выиграло матч всухую.artemerschow
13.03.2016 15:38+1Сомневаюсь, что для них 5-0 было бы предпочтительнее. Им самим было важно нащупать слабые места ИИ и это случилось.
valemak
13.03.2016 15:52+5Слабые места можно нащупать и без поражений. Матч с Фань Хуэем выявил существенные ошибки программы и для создателей AlphaGo счёт при этом был очень приятен :)
agzamovr
13.03.2016 13:55+3Необходимо упомянуть также то, что Седоль указал на слабость AlphaGo при игре черными. На пресс конференции он попросил у Демиса Хассабиса в последней игре опять играть белыми, на что Хассабис дал согласие. Если Седоль действительно нащупал слабую сторону программы, то в последней игре у Ли есть хорошие шансы на выигрыш.
valemak
13.03.2016 14:06+2Всё может быть. У белых изначально компенсация в 7,5 очков, чёрным приходится прилагать усилия по нивелированию этого разрыва. Возможно, в алгоритмах компьютерной системы существуют изъяны и величина китайского коми не уравновешивается правом первого хода.
flashtech
13.03.2016 14:38+23Если судить по словам разработчиков, то первая ошибка (на 79 ходу) — это ошибка именно value network. AlphaGo некорректно оценивала свою позицию, как выигрышную, вплоть до 87 хода.
А вот дальнейшие «ошибки» это уже видимо следствие алгоритма MCTS и методики обучения. AG проигрывала небольшое количество очков (по оценкам комментатаров в пределах коми) и на столе были возможности отыграть там пару, там пару и может быть в отдаленной концовке удалось бы уравнять, особенно если навязать сложный ко-файт.
Но сети AlphaGo были обучены только на бинарную оценку (победа/поражение), потому уменьшение отставания для нее не было приоритетом (грубо говоря, она не видала разницы между поражением в 20 и в 1 очко). Потому при анализе дерева отдавалось предпочтение ветвям, которые в пределах просчета давали видимые шансы именно на победу.
Для наступления такой победы требовались маловероятные (крайне ошибочные) ответные ходы от Ли Седоля, но алгоритм из-за своей архитектуры отдавал предпочтение таким ветвям перед более безопасными, но не дающими очевидных шансов.
Вот и получился тот набор ошибок AI в конце, когда тот играл «детские» ходы (а по сути в надежде на детскую ошибку оппонента), которые Ли Седоль тут же наказывал.KvanTTT
15.03.2016 15:08+2В твиттере про 78 ход пишут: "Taken a quick look at the logs: AlphaGo gave a probability of <1 in 10000 for Lee's brilliant move 78, so AG found this move very surprising".
tasman
13.03.2016 15:04+3Если переводчик не напутала, то Ли "просил" сыграть чёрными и это была шутка https://youtu.be/yCALyQRN3hw?t=22455
lksdfj89
13.03.2016 15:07+1Разве это была шутка? Ребята из гугла, вроде бы, согласились.
tasman
13.03.2016 15:09+9Он в любом случае должен после белых играть чёрными. Он "попросил" играть чёрными, "так как белыми он уже выиграл". Ребята из гугла "согласились".
l27_0_0_1
13.03.2016 17:03В последней игре кто будет играть черными должно было решаться броском монеты.
tasman
13.03.2016 17:24+1А где можно глянуть правила на этот счёт? Быстрый гугл не помог.
l27_0_0_1
13.03.2016 17:42+1Это правила самой игры. Правда, я немного наврал, что броском, но вероятность выбора должна быть как у броска монеты.
tasman
13.03.2016 17:51+3Перечитал дважды, поправьте если я не правильно понял.
Нигири применяется:
1 В начале серии партий, для определения цвета (Ли и АльфаГо тоже разыгрывали нигири в первую игру), потом цвет чередуется.
2 После достижения счёта 3:3 в чемпионате, игроки снова разыгрвают нигири (я так подозреваю, что для 5 игр было бы 2:2)
Не нашёл по вашей ссылке правила, что бы в последней игре серии разыгрывали нигири в любом случае, пишут про ничью по очкам перед последней игрой.l27_0_0_1
13.03.2016 18:38+1Я так понимаю, что 3:3 (в нашем случае это 2:2, соответственно) относится к количеству сыграных партий за каждый из цветов, чтобы поставить игроков в одинаковое положение, в последней игре снова разыгрывается нигири.
tasman
13.03.2016 18:47+1After reaching a 3-3 tie in a championship series[...]
tie довольно однозначно переводится как ничья, равный счёт. (https://slovari.yandex.ru/tie/%D0%BF%D0%B5%D1%80%D0%B5%D0%B2%D0%BE%D0%B4/)
Есть даже значение "решающий матч после ничейного результата".
Welran
14.03.2016 06:47+1Так как при счете 3-1 нет смысла играть пятую партию и пятая партия играется если никто не выиграл в предыдущих, то разыгрывать нигири перед последней партией и разыгрывать нигири при равенстве очков это одно и тоже.
lksdfj89
13.03.2016 13:59+2У меня возникла пара вопросов.
Комментатор говорил, что развитие alphago позволит найти новые техники и улучшит игру людей. Компьютер давно выигрывает в шахматы, но помогло ли это найти новые техники?
Alphago будет одинаково отвечать на один и тот же ход или там есть доля случайности? Т.е. можно ли повторить этот матч 1 в 1 и победить не размышляя над ходами?valemak
13.03.2016 14:11+4Компьютер давно выигрывает в шахматы, но помогло ли это найти новые техники?
Вне сомнения. С помощью компьютерного анализа шлифуются дебютные варианты. Множество прорывов совершено в эндшпильной стадии (вплоть до того, что просчитаны все 6-ти фигурные окончания).
Alphago будет одинаково отвечать на один и тот же ход или там есть доля случайности?
Присутствует доля случайности в виде метода Монте-Карло. Повторение партии 1 в 1 невозможно.BelBES
13.03.2016 16:43+1Присутствует доля случайности в виде метода Монте-Карло. Повторение партии 1 в 1 невозможно.
Зависит от имплементации ГПСЧ, не? С одним и тем-же сидом, вероятно, партия должна повторяться 1 в 1.
ну и, естественно, нужна та-же версия системы… и тут вполне вероятно, что альфу могут дообучать между партиями…
KvanTTT
13.03.2016 14:15+1Вряд ли- там как минимум используется метод Монте-Карло, который привносит элемент случайности.
crazylammer
13.03.2016 14:16+2Комментатор говорил, что развитие alphago позволит найти новые техники и улучшит игру людей. Компьютер давно выигрывает в шахматы, но помогло ли это найти новые техники?
Я не специалист по шахматам, но вот заслуживающий внимания комментарий на английском:
Any opening is pretty much playable given the right amount of analysis. Moves that were once considered not playable have found new life in painstaking objective analysis.
Многие ходы в дебютах, которые до этого считались слабыми, получили новую жизнь
… Basically, now anyone can prepare for anyone
Раньше существовали более или менее закрытые (например, в СССР) "базы данных" про стили игры известных игроков. Сейчас с помощью AI такую информацию гораздо проще собрать и проанализировать.
paniquehistoire
13.03.2016 14:20+1Смотря насколько быстро обучается система. В долгосрочной перспективе определенно нет. В этом кстати нет большого отличия от человека (достаточно вспомнить любые случаи из жизни, когда повторяешь одну и ту же ошибку, уже зная о ней).
lanseg
13.03.2016 14:02+8А я за робота болел
valemak
13.03.2016 14:11+15Пятая колонна!
a_batyr
13.03.2016 14:16+9Я тоже за АльфаГо болел. За ИИ наше будущее. Слава Роботам!
PavelGatilov
13.03.2016 22:03+2А я всегда считал что будущее за апдейтом человеческого мозга и тела.
ankh1989
14.03.2016 07:51+1Роботы тоже так думают (вспомнил Quake 4 где строгги "улучшали" людей и заставляли воевать за себя).
evtomax
13.03.2016 14:05-4Один человек сражался с целым дата-центром? Мне кажется, что надо ввести ограничение на потребляемую компьютером мощность. 200 Вт, например.
KvanTTT
13.03.2016 14:28+7Если подвести к человеку десятки кВт энергии, то играть он от этого лучше не станет. Этот вопрос уже обсуждался.
evtomax
13.03.2016 14:31А если против дата-центра будет играть команда из 1000 человек?
Sleepwalker_ua
13.03.2016 14:39+3попробуйте сначала согласовать 1000 человек. Это вам не это…
У каждого собственное мнение, видение игры, личный опыт, гордость, стремление к лидерству, тщеславие… Будет не игра, а фарс.evtomax
13.03.2016 14:52+1Если я не знаю, как эффективно согласовать 1000 человек в данной игре, то это не значит, что такое невозможно.
Frosterman
13.03.2016 17:14+2Ну вот когда человечество выйдет на новый уровень биологического или технического развития и сумеет объединять или синхронизировать сознания в реалтайм режиме. В текущем варианте даже 10 человек в совместной игре воспроизведут ситуацию из басни Крылова и на выяснение чья идея лучше будет уходить гигантское кол-во времени и внимания.
Актуальней давать игроку больше времени на обдумывание. Практически во всех партиях у Седоля кончалось время и принимать важнейшие решения ему приходилось всего за 1 минуту.evtomax
13.03.2016 18:19+1Толпа — не единственный возможный способ организации деятельности большого количества людей.
PavelGatilov
13.03.2016 22:04Обычная демократия? Собрать 1000 игроков А класса в ГО, а дальше за каждый ход или стратегию голосовать
Necrozyablo
13.03.2016 23:20+2Смысла нет. Даже в топ100 разница между 1 и 100 в 300 эло. При 1000 будет разница от 3600 до 2500 эло.
Есть к слову турниры командные, где ходы обсуждаются, но даже там больше чем 3 человека на команду нет.
Фактически можно взять человек 5-10 самых топовых и чтобы они сами из каждого хода играли и обсуждали варианты, тогда думаю профит будет. Но для этого нужно на партию выделять минимум часов 20. На этом шоу тяжело построить.
DeepBlue
14.03.2016 04:37+3Практика показала, что демократия в шахматах неэффективна:
en.wikipedia.org/wiki/Kasparov_versus_the_World
Сомневаюсь, что в го выйдет лучше.roboq6
14.03.2016 05:37+1Там потом оказалось, что Каспаров читал обсуждения коллективной стратегии The World Team.
KvanTTT
13.03.2016 14:43+2Такое количество людей не успеют синхронизироваться не только за игровое время, но и вообще за какое-то приемлемое время. А если время увеличить на порядок, то и компьютер станет глубже считать. Если брать слаженную команду до 10 человек, то может качественно что-то и улучшится.
plm
14.03.2016 04:37Вот это меня тоже возмущает. Но на мой взгляд надо ввести ограничение какое-то более относящееся к обоим партнерам. Максимальный вес, например. Вики говорит, что самый тяжелый человек весил 635 кг (хотя статью про самых тяжелых игроков в го не искал), вот пусть в эту массу впихивают все. Если во время игры можно есть-пить — компу повезло, топливо для генератора на всю игру можно не учитывать в этом весе. И никаких подсказок со стороны.
Cr558
13.03.2016 14:33-17Закидайте меня помидорами, добейте карму, но я думаю это шоу. Слишком драматично, эпично и все дела. Взяли не самого сильного игрока, но самого так понимаю колоритного из лучших. Сначала сделали сенсацию выиграв 3и подряд, теперь, интрига человека выиграл. Причем кто, кому поддается еще неизвестно. Может программа слабее, чем думают, может её ослабили для обострения ситуации, может AlphaGo лишь инструмент, а удаленно с помощью просчетов позиции на кластере играет комманда высокого уровня. А может я параноийю весной схватил. Но вот клянусь моей шапочкой из фольги, маркетологи бы сделали так, 5:0 неинтересно, а вот 3:2 или 4:1 и политически корректно к белковыми, и привлечет их внимание. А может это шоу в стиле смотрите какой гугл молодец. Пойду таблеток выпью, чтоле.
GreenGoblin
13.03.2016 14:50+7Едва ли. В Азии к го относятся очень серьезно, гроссмейстеров почитают как национальных героев, всякие пафосные титулы им выдумывают. А если посмотреть на проигрывающего Седоля, все мысли о подставе должны сразу отпасть.
Да и гуглу это тоже ни к чему, в конце концов победа робота была вопросом времени, а миллион зелени для него — капля в море.
dom1n1k
13.03.2016 16:52+2Когда канадцы проиграли свой домашний ЧМ по хоккею, некоторые тоже говорили, что там все куплено :) Лично слышал своими ушами.
Frosterman
13.03.2016 17:27+2сразу видно человека который мало или вообще не играл против компа. Возьми любой файтинг или стратегию где приходится играть против ИИ. Выбери режим hardcore и получится стандартный расклад для среднестатистического игрока: первые стычки проигрываются вчистую, затем изучение тактики и алгоритмов ИИ и выстраивание контр-стратегии, затем первые удачи и в итоге гарантированные победы с минимальными усилиями. Для игрока который прошёл все эти стадии игра против этого ИИ уже теряет смысл т.к. победа достаётся слишком легко и предсказуема. Так и тут — если Ли Седоль нащупает слабые стороны ИИ, то сможет эффективно их использовать раз за разом. Вопрос только в том что с той стороны сидят программисты которые так же внимательно следят за косяками своего детища и в состоянии подкрутить алгоритм в перерывах между играми. Но в любом случае я бы не удивился результатам в стиле fail — fail — fail — win — win — win
roboq6
13.03.2016 17:35+1>Вопрос только в том что с той стороны сидят программисты которые так же внимательно следят за косяками своего детища и в состоянии подкрутить алгоритм в перерывах между играми.
Важная фишка AlphaGo это самообучение. Поэтому в отличии от игровых ИИ Alphago не будет каждый раз наступать на одни и теже грабли.Frosterman
13.03.2016 17:56+3сомневаюсь что на анализе одной единственной партии Alphago сумеет чуть ли не в реальном времени перестроить всю свою стратегию. Так может человек, но не ИИ построенный на современной реализации нейронных сетей.
Cr558
14.03.2016 01:55+1Пальцем в небо. Как раз имею опыт игры против ИИ в шахматы и за 3и партии выяснить слабые места, так, чтобы вчистую выиграть невозможно, если только изначально его непревосходишь в разы. Го так же игра с полной информацией и здесь фишки как в героях/старкрафте и т.п. где компьютер не знает, что вы там на базе делаете и куда ведете основные силы не прокатят. Если всего за 3и игры Седоль нащупал выигрышную стратегию это говорило бы о слабости ИИ.
Кармы мало, поэтому отвечу здесь и другим. Все эти сказки о том как в Азии чтут Го, что прям сенсей сделает харакири если проиграет, напоминают небылицы, что все русские прям дофига шахматисты времен СССР. Да, у них есть традиция, но ненадо думать, что чм по Го, шахматам или городкам нельзя купить. Что прям в Азии все по чину. Вы еще экскурсоводам поверьте в курортном городке. Коррупция в том же Китае не хуже российской, куда больше, чем в США, за Южную Корею не знаю, но думаю не лучше Западной Европы. Поэтому детскую веру в принципиальных азиатов оставьте там же где жители Сибири ходят в обнимку с медведями, грузины все как один гостепреимные, евреи богатые, а французы донжуаны. Именно интрига выгодна всем, от Ли Седоля до Гугла. Если не понимаете почему так, почитайте те же азиатские тракты типа «Искусства войны».Welran
14.03.2016 07:31+1Ну 3-0 это не интрига. вот было 2-1 тогда была бы интрига сумеет ли чемпион мира обыграть бездушную машину. А потом ещё и 2-2 вообще бы подогрело интерес. А так никакой интриги которая была бы «выгодна всем».
valemak
14.03.2016 07:35Про харакири была шутка, разумеется, высмеивающая как раз стереотипы про азиатов. Тем паче, что харакири, вроде как, не входит в корейскую традицию.
KvanTTT
13.03.2016 14:47+4Гугл заинтересован в победе в сухую, и это как раз таки очень эффектно было бы. Поэтому намеренно ослаблять AlphaGo у него точно нет резона.
ZlodeiBaal
13.03.2016 16:05+2Мой друг, который очень круто в Го играет говорит, что первая ошибка была на 23 ходу. Это какая-то очень стандартная комбинация, в которой альфа го сыграл как новичок. Потом бот повторил два раза ход из второй партии (на 25 и 47 ходу), который тогда Ли поверг в шок, а теперь Ли уже явно подготовился как против такого играть. Ну и да, потом серия явных ошибок, особенно после большого окружения.
f0rk
13.03.2016 22:47+7Судя по вашему комментарию, ваш друг не очень круто играет в го. "ход из второй партии" — это стандартный прием, даже название у него есть — "удар в плечо". Его необычность во второй партии в том что он был сделан по отношению к камню стоящему на 4-й линии, к камню на 3-й (как в последней партии) его играют достаточно часто и ничего необычного в этом нет. Между прочим, до хода 78 и последующей комбинации в центре, позиция на доске многими профессионалами оценивалась как благоприятная для белых. Ход E4 (23-й) тоже не выглядит как ошибка, скорее как проверочный ход. Ли Седоль потратил 2 хода чтобы этот камень забрать, мне сложно оценить эту комбинацию, но по моему субъективному мнению не очень крутого игрока (3 дан РФГ), плохим этот ход назвать сложно, и уж точно не тянет это на "игру новичка".
ZlodeiBaal
15.03.2016 01:56Да, не очень, наверное. 4д на европейском сервере, 6д на китайском и корейском
В России вроде года 3-4 назад дошёл до 2д, потом забросил местные турниры. По рейтенгу РГФ был топ-20 тогда, чемпион Питера.
Я сам играть не умею. Сказанное мной он озвучивал с отсылкой к разбору партии Ли Седоля 9ми данами. Там есть два англоговорящих, один американец, один китаец.f0rk
15.03.2016 14:43Как-то не сходится все. 2д никогда не мог быть в топ-20 РФГ, этого недостаточно даже чтоб в сотню войти, хоть сейчас, хоть 3-4 года назад. Да и чемпионат Питера 2д вроде не выигрывал на моей памяти. И не могу я поверить, что 4д скажет что E4 это ход новичка (разборы партий я тоже смотрел). Не скажете как вашего друга зовут?
ZlodeiBaal
15.03.2016 15:10Евгений Дергач его зовут.
Точность формулировок я мог не сохранить, но смысл был примерно такой. Е4 -явный оверплэй, свойственный новичкам, два удара в плечо — ни о чём, причём первый — ошибка Ли что он не ответил агрессивно.f0rk
15.03.2016 15:55+1Е4 -явный оверплэй
Спорная формулировка, такой ход в принципе играют, можно подумать над тем, насколько вовремя он был сыгран.
свойственный новичкам
Вот это точно нет. Там есть хорошие продолжения. Если новичек и может сыграть такой ход, то только случайно :)
два удара в плечо — ни о чём
Первый был вполне о чем, и он как раз был связан с продолжениями в углу, для того чтобы сыграть более агрессивный ход в углу, черному потребовалась бы поддержка на стороне. Второй более спорный на мой взгляд, я бы накрывал через пункт сверху в такой позиции, но не мне судить машину, которая мне камней 6 форы дать может :)
Но в текущей формулировке, у меня гораздо меньше желания назвать написанное ерундой.
f0rk
14.03.2016 01:04+3Ну и да, потом серия явных ошибок, особенно после большого окружения.
Явная ошибка со стороны альфаго была в партии только одна, 97-й ход C4 и произошла она после того как бот "понял" что шансы на выигрыш явно упали. Возможно, что это связано с алгоритмом, который не учитывает величину выигрыша/проигрыша в очках, его единственная цель максимизировать вероятность выигрыша не зависимо от его величины. Думаю что инженерам гугла стоит подумать о том, чтобы в ситуациях, когда бот проигрывает, он менял стратегию и начинал играть на уменьшение отрыва а не на увеличение вероятности выигрыша. Если отрыв в очках сократить, то появляется возможность обыграть человека в концовке.
dom1n1k
13.03.2016 16:54-1Мне кажется, цвет нужно было не разыгрывать, а чередовать.
Плюс я бы дал человеку право выбора цвета в первой партии.
yefrem
13.03.2016 16:54Как и в первой и второй играх, Седоль исчерпал время раньше оппонента. То есть в какой-то момент человек был вынужден тратить всего по минуте на ход.
Э… ограничение времени при игре с ИИ? Но ведь это нечестно, разве нет? Может я не понял из-за того, что не играю в го, но звучит очень странно.Frosterman
13.03.2016 17:52+2Стандартные правила игры в Го, по которым играют оба. А правила проверены временем и ориентированы на физические возможности человека. Без проф подготовки поиграть в Го против равного или более сильного игрока много не получится — уже через 2-3 часа такой игры ощущаешь себя как выжатый лимон и физической усталостью сравнимой с пробежкой в десятки км. Да и растягивали бы эти партии фиг знает как — проигрывающий игрок будет до последнего тянуть при каждом ходе пытаясь найти выход из патовой ситуации…
Да и насчёт честности тут тоже не всё так просто — если дать человеку больше времени, то придётся его же давать и ПК. А это — лишние итерации и возможность дальше просчитать последствия хода. При наличии неограниченного времени ПК даже с самыми примитивными алгоритмами будет иметь 100% шанс победыRMV1983
13.03.2016 18:03+1Стандартные правила игры в Го, по которым играют оба. А правила проверены временем и ориентированы на физические возможности человека.
Правильно. Человека. Вот он и упёрся в эти ограничения. Для ИИ ограничения должны быть другими.
Хотя для первых игр важна принципиальная победа ИИ.
При наличии неограниченного времени ПК даже с самыми примитивными алгоритмами будет иметь 100% шанс победы
Не согласен. В этом случае скорее вопрос кто кого переживёт. Вроде бы срок службы микросхем пока что меньше продолжительности жизни человека.
(Вспомнилась почему-то притча про Ходжу Насредина. И его фраза. Либо ишак, либо падишах, либо я.)Frosterman
13.03.2016 18:48+1Правильно. Человека. Вот он и упёрся в эти ограничения. Для ИИ ограничения должны быть другими.
возможно. Но тут уже проблема как высчитать эти ограничения. Для ИИ ограничение времени на ход имеет даже более серьёзные последствия, чем для человека. Человек в конце концов может сделать ход инстинктивно, а вот пк без точных расчётов превращается в дебила. Те же блиц партии с 15ти секундными ходами AlphaGo вряд ли сможет выиграть даже у более слабого противника.
Имхо самый интересный вариант сейчас был бы с партией растянутой на несколько месяцев. Скажем 12 часов днём отдаётся человеку на ход и 12 часов ночью для ПК. Обмен ходами раз в сутки. Это даст максимальную фору обоим участникам и позволит использовать все свои ресурсы и возможности для обоих сторон.RMV1983
13.03.2016 19:45+1возможно. Но тут уже проблема как высчитать эти ограничения.
Я предлагаю подойти с другой позиции. В каком направлении мы бы хотели видеть развитие техники? И уже отсюда придумывать ограничения. Ведь понятно что какие бы ограничения придуманы не были, их будут пытаться обойти. Так пусть пытаются в той сфере, что даст пользу всей отрасли, а не её отдельному сегменту.
Это касается качественных характеристик, т.е. того — что вообще стоит ограничивать?
А по поводу количественных, т.е. конкретных значений всё проще, мне кажется.
Сейчас же не проводятся регулярные соревнования и вопрос пока ещё не такой острый.
Нужно взять текущее состояние AlphaGo. И с каждым годом уменьшать его, скажем на 10%. Конкретное значение можно брать скажем из среднего прироста в отрасли. Это оставит множество векторов для развития. А если окажется, что этого не достаточно и ИИ выигрывает в 100%, то тогда можно будет подумать над ещё одной качественной характеристикой.
Вообще, этот вопрос сейчас мало актуален, поскольку любое нормальное ограничение урежет возможности ИИ слишком сильно. Здесь мне видится актуальным именно постепенное поступательное изменение/улучшение.
А ваш вариант интересный, согласен. Особенно сейчас, когда человек ещё может победить.
agranom555
13.03.2016 17:53+2Время хода ограничено. Все правильно. Ведь тогда и ИИ может думать па часу на ход. А так тоже вынужден быстро думать
RMV1983
13.03.2016 18:05+2Э… ограничение времени при игре с ИИ?
Я вот тоже не понимаю.
То есть в какой-то момент человек был вынужден тратить всего по минуте на ход. AlphaGo же хорошо распоряжалась временем — это результат добавления нейросети, которая помогает управлять им.
Канал нужен для связи с дата-центрами компании, где на сотнях процессорных ядер и видеоускорителей запускается AlphaGo.
При чём здесь эффективность нейросети, если используется огромнейший кластер? Если производительность по времени будет недостаточной, то, насколько я понимаю, мощность можно увеличить. И делать так дотех пор, пока скорость не станет приемлемой.
Да, нейросеть вещь необходимая. Но именно мощность вычислений ничто (кроме денег) не мешает нарастить другим путём.
У человека же мощность, в силу биологических причин, пока что, нарастить не представляется возможным.
Должно быть какое-то ограничение. А то так (условно конечно) все сервера гугла можно на ограниченное время подключить к расчётам, а потом удивляться, что эта система принимает решение быстрее человека.
Да, победа без ограничений это важный шаг. Можно сказать, принципиальный. И теперь вопрос лишь в мощности. А значит, что пора придумывать ограничения.
Да, я уже видел ветку с ограничением по мощности. Забавно. Если такое примут, то будет развиваться энерго-эффективность. Но принять такое ограничение для всег кластера… мне кажется не реально. Но согласен, к этому можно стремиться.
Есть ещё идея, на будущее. ИИ должен присутствовать на состязании целиком. И успевать "сесть за стол" за то же время, что и человек. Опять же, прямо сейчас это не реально.
В будущем, мне кажется было бы не плохо постепенно вводить эти ограничения. В таком случае, мы получим прогресс в миниатюризации энерго эффективности. Уже сейчас можно начать, установив текущие мощности AlphaGo как максимальную планку. И договорившись понижать е каждый год. Причём даже не важно насколько.
Можно даже забить на всё это и придумать нечно иное. Но миниатюризация и энерго эффективность мне кажутся более предпочтительными. Что насчёт иметь своего персонального AlphaGo на телефоне или умных часах и не переживать по поводу батареи?Here_and_Now
13.03.2016 19:50+1Для начала, мне кажется, DeepMind и Google будут решать проблему самого ИИ в том или ином виде.
А проблема энерго-эффективности — она решается на уровне самого гугла. Скажем DeepMind добавят что-то в поисковый движок, и команда гугла будет работать над оптимизацией. Т.е. энерго-эффективность только тогда, когда алгоритм интенсивно работает над real world problem.
Zavtramen
13.03.2016 18:48+5Канал нужен для связи с дата-центрами компании, где на сотнях процессорных ядер и видеоускорителей запускается AlphaGo
И какую же именно информацию они гоняли от доски до дата-центра что им потребовался отдельная оптика? Просто перестраховались за связь вообще, а написали так, как будто там видео-стримингом занимались. По сути там и мобильного Edge много было бы )
Here_and_Now
13.03.2016 19:44+3Так и представляю, как сегодня ночью перед следующей игрой, Альфа Го будет посылать армии друг на друга, эмулируя проигранную игру снова и снова, а какой-то внутренний процесс подкрепления с плёткой будет приговаривать "Не делай больше таких глупых ошибок".
Halt
13.03.2016 20:08+2Справедливости ради стоит отметить, что этого не происходит. Разработчики уже заявляли, что между партиями программу не модифицируют и в процессе никаких рычагов воздействия не имеют. Видимо посчитали, что так будет интереснее.
RomanStrlcpy
13.03.2016 21:52+2А самообучени в процессе игры происходит?
Halt
14.03.2016 07:25+4Чтобы обучаться на текущих ходах, надо знать их реальный исход. Если партия была выиграна, то сети накидывается поощрение, ход за ходом.
Подозреваю, что в течение партии этого не делают, ибо на руках у машины будет только оценка вероятности успешного исхода партии из заданной позиции, ну и прикидки монте-карло, которые тоже могут быть необъективными (как показала нам 4 партия).
solariserj
13.03.2016 22:45Ну ИИ называют по традиции с машинным противником. Он ведь построен на нейронной сети, то есть такая "китайская комната" натренированная делать определенные ходы в определенных ситуациях. Поэтому с таким подходом можно любую логическую игру выйграть, главное грамотно описать
SkidanovAlex
14.03.2016 06:12+11Утверждается, что люди будут всегда называть ИИ систему, способную решать множетсво задач, которые еще не решены текущим ИИ, а все, что решает текущий ИИ, называть не настоящим ИИ: о)
Ваш мозг тоже построен на нейронной сети, то есть это тоже такая "китайская комната" натренированная на какие-то базовые задачи, многие из которых более тривиальны, чем игра в го. В частности, она пока у вас плохо научена правильно писать слово "выиграть".
SkidanovAlex
14.03.2016 06:07+1Система признаёт поражение, когда оценка шанса победы падает ниже 20 процентов
Это не верно, согласно этой статьи: https://habrahabr.ru/post/279071
AlphaGo сдается, если у всех ходов Q-score < -0.8, т.е. вероятность выиграть меньше 10%.
Интересно, что в октябре Фань Хуэй тоже выигрывал у AlphaGo, но только в одной из пяти неформальных игр.
это тоже не верно, он выиграл в двух из пяти, и там было важное ограничение — 30 секунд на ход: https://gogameguru.com/go-commentary-deepmind-alphago-vs-fan-hui-game-5
He won two unofficial games against AlphaGo (30 seconds per move), but lost all the official games.
atomlib
14.03.2016 06:23+1Данные про 20 процентов — это слова инженера Google. Про две игры исправил, спасибо.
sim31r
14.03.2016 13:18+3Удивила логика программы. Есть вероятность выиграть, хоть и 20%, а она сдается. Такое может быть обоснованно при экономии облачных мощностей. Но на этапе обучения мощности требовались выше, чем при игре, так что вариант отпадает.
vxd_dev
14.03.2016 15:27+2Мне, наоборот, это кажется логичным, ведь если твой противник в данной конкретной игре смог снизить твои шансы до 20% (выше упоминалось 10%), то в данный момент он сильнее и нужно ждать откровенной ошибки с его стороны, чтобы изменить ситуацию, а тут, насколько я понимаю, еще появляется лимит по времени.
roboq6
14.03.2016 15:32+4Ну и что? Если наша цель — победа любой ценой (а именно на это запрограммирован AlphaGo), то надо сражаться до конца, какими бы призрачными не становились наши шансы на победу.
Lure
15.03.2016 13:21+1Кстати, в покере при игре вживую всегда есть ненулевой шанс выиграть даже если соперник собрал старшую возможную комбинацию и не собирается сбрасывать. Причём, выигрыш в таком случае случится без нарушения правил. Но это крайне маловероятная ситуация.
atomlib
14.03.2016 15:40+4Это заложено намеренно для сохранения культуры поединка, чтобы не получалось, что машина продолжает играть, хотя проигрыш уже очевиден.
roboq6
14.03.2016 16:00+2А что, в Го нету такого момента когда противник просто вынужден окончить игру, как мат в шахматах?
valemak
14.03.2016 16:19+3Да и в шахматных поединках (если это солидное соревнование, а не во дворе на лавочке играют) тоже не играют до мата включительно.
Если тянуть до последнего, тот тут одно из двух. Или надеешься что соперник грубо ошибётся и своим нелепым ходом даст шанс. Это полнейшее неуважение к сопернику, особенно если это игрок высшей категории. Как будто надеешься, что перед тобой на самом деле не гроссмейстер, а какой-то дурачок.
Или же речь о том что противник в цейтноте, израсходовал своё время и вот-вот на его часах упадёт флажок. Тогда вполне корректно продолжать игру. Однако в го обычно контроль времени, в котором цейтнота как такового практически возникнуть не может. В худшем случае у противника 1 минута на 1 ход. Для игрока уровня Седоля это абсолютно достаточно, чтобы спокойно закрепить победу.
valemak
14.03.2016 16:24+2Кроме того в го аналога мата нет. По окончанию игры подсчитываются очки.
Если в шахматах часто есть призрачный шанс подловить соперника на внезапную комбинацию, то го это игра в которой столь внезапные повороты в заключительной стадии партии практически исключены. В конце партии игроки пожинают плоды своей терпеливой стратегии, если у кого-то очевидный выигрыш, то надеяться на чудо не приходится — таковы особенности игры.
vlivyur
14.03.2016 16:19+110% шанс на победу это далеко не очевидный проигрыш.
valemak
14.03.2016 16:29+2Смотря что за игра. В шахматах одна удачная комбинация может всё перевернуть с ног на голову. В го совершенной другой характер игры, если преимущество опытного противника достаточно большое, то на спасение шансов практически нет.
SkidanovAlex
14.03.2016 19:27+1то на спасение шансов практически нет.
Тогда это и не шанс 10%. Шанс 10% — это достаточно ортогональная типу игры вещь, которая говорит, что если бы мы сейчас вселенную форкнули раз так миллион, то в 100К вселенных мы бы выиграли. Учитывая специфику го, это на деле должно обозначать достаточно близкую позицию с незначительным перевесом.valemak
14.03.2016 19:39+1Насколько я понимаю из объяснений по поводу того как AlphaGo с помощью метода Монте-Карло ищет оптимальный новый ход, то могу предположить по поводу упомянутых 10-20% примерно следующее:
Из возможных условно случайных продолжений игры, в 10% вариантов преимущество у компьютера, 90% — у человека. Но это отнюдь не значит, что на практике вероятность того что, что реальная игра с вероятностью 10-20% пойдёт по пути из этих 10-20%, найденных с помощью метода Монте-Карло. Так как противник-человек пользуется не методом Монте-Карло, а просто идёт по очевидно выигрышному пути, то выигрышные для него "монтекарловские" 90% в реальности — это больше 99%.
isotoxin
Психологический пресс снят — всё равно на круг уже проиграл. Играл на расслабоне. Вот и выиграл :)
valemak
Да, миллион долларов призовых уже был неактуален, осталось просто получать от игры удовольствие. Впрочем, Седоль так раскачивался над доской во время партии, что создавалось впечатление будто он проигрывает в разгромном стиле.
kranky
> создавалось впечатление будто он проигрывает в разгромном стиле.
Блефовал, чтобы ИИ потерял бдительность. Сработало похоже.
ghostinushanka
Интересно на самом деле, ведь компьютер не подвержен «психологическому стрессу». Как по мне это один из важнейших факторов итогового счёта 3:0 по результатам предыдущих партий.
Сколько раз уже бывало в любом из видов спорта что даже явный фаворит проигрывал, просто потому что «плющит».
А сей раз Седоль просто играл себе в удовольствие и в центре «затащил на расслабоне».
Vlad_Hm
Самое страшное начнётся, когда АльфаГо начнёт играть на расслабоне. После того, как круг уже выиграла… и вправду, чего электроны туда-сюда впустую гонять, когда можно подумать о чём-то более интересном?
Вот тогда противникам курить нервно за углом будет уже поздно.