Совсем недавно на Geektimes публиковалась информация о том, что AlphaGo, компьютерная система, разработанная компанией DeepMind, победила чемпиона мира по го Кэ Цзе в первом из трех матчей в рамках праздника го. Перевес компьютера по очкам был совсем небольшим, но некоторые эксперты посчитали, что разработчики Deep Mind просто не захотели, чтобы система разгромила мастера, для добавления зрелищности этому матчу.
Некоторые профессиональные игроки в го с высоким даном, следившие за ходом матча, заявили впоследствии, что человек вряд ли способен выиграть у компьютера. Возможно, подтверждением этих слов можно назвать результаты второго матча, в котором снова победил компьютер, ранее побивший Ли Седоля.
Комментаторы отмечают, что в новом матче Кэ играл практически идеально в течение первых 50 ходов. Он использовал достаточно сложную стратегию, развивая различные сценарии на доске. Но AlphaGo «заметила» угрозу и смогла справиться с атакой на всех фронтах. Впоследствии система вынудила чемпиона сдаться. «Первые 100 ходов мы видели, пожалуй, лучшую игру из всех, что когда-либо проводились с Master-версией AlphaGo», — заявил глава DeepMind Демис Хассабис.
Сам Кэ сказал после мачта, что новая игра отличалась от предыдущей. Дело в том, что AlphaGo делала ходы, которые выходили за рамки выигрышной стратегии, которую на месте системы мог бы использовать сам Кэ.«Я думал, что я был близок к победе в середине игры, но AlphaGo думала по другому. Мне немного грустно и я сожалею, поскольку я думал, что играл очень хорошо», — заявил чемпион.
Напомню, что Цзе заявил о своем отказе играть с компьютером после завершения серии матчей с AlphaGo.
Комментарии (56)
zuborg
25.05.2017 17:41+1Интересно, насколько вырастет уровень игры топовых игроков, когда они потренируются в несколько сотен игр с АльфаГо. Среди профи бытует мнение, что уровень игры чемпионов Го принципиально не меняется уже тысячи лет.
ertaquo
25.05.2017 17:45+2Заметьте, от этого будет расти уровень не только игроков, но и AlphaGo.
roboq6
25.05.2017 18:16+1Тогда возможно стоило бы временно отключить функцию самообучения, позволив профессионалам набраться опыта и нащупать слабые места AlphaGo. Думаю Google это было бы интересно.
webmasterx
26.05.2017 14:50И чем же? Мне кажется гораздо интереснее найти те места, где AlphaGo упрямо не учится.
roboq6
26.05.2017 16:17места, где AlphaGo упрямо не учится
Я сомневаюсь что такие места вообще есть.
И чем же?
Во-первых, это позволит понять насколько сильней стал AlphaGo. А для этого нужно его несколько раз победить, нащупать слабые места. Фигурально выражаясь, чтобы понять насколько высока стена нужно через неё перелезть. Что довольно проблематично если сама стена находится в постоянном процессе быстрого роста. Возможно уже через месяц заморозки, постоянных интенсивных игр с профи и тщательного исследования сыгранных партий будут найдены слабые места которые позволят сокрушать AlphaGo во время каждой партии как гнилой орех. Возможно слабые места будут найдены лишь через год, и то они будут давать лишь призрачный шанс на победу. А возможно победы над ним не будет и через 10 лет, но зато сообщество Го получат НЕисчерпаемый источник высокоэффективных и креативных стратегий/приёмов игры (в этом случае AlphaGo уже фактически достиг уровня всезнающего непобедимого гуру Го. По крайней мере с человеческой точки зрения).
Во-вторых, было бы интересно устроить эдакую «гонку вооружений» между элитой Го и AlphaGo. Сначала происходит заморозка и профи ищут слабые места AlphaGo, попутно повышая своё мастерство и обогощая познания человечества в области Го (кстати, интересная мысль — создать искусственного эксперта чтобы потом пытаться перенять его опыт). После нескольких побед над AlphaGo происходит разморозка, он учится на своих ошибка и перестаёт проигрывать. Потом снова заморозка и снова поиск слабостей. Тут можно будет увидеть насколько быстро и гибко будут адаптироваться как AlphaGo так и люди играющие против него. Будет ли людям с каждым разом всё трудней и трудней «подобрать ключик»? Достигнет ли AlphaGo такого состояния когда люди будут неспособны его побеждать даже в состоянии заморозки?
slonofanya
25.05.2017 22:28+1Думаю дальше уже интереснее наблюдать за игры между ИИ. Скорее всего для этого учредят отдельную лигу. А потом подключат их к мозгу и станет еще интереснее, надеюсь )
Camrad_RIP
27.05.2017 05:51Нормальному человеку (тм) наблюдать за такой игрой все равно что смотреть как математики теорию относительности обсуждают.
Necrozyablo
25.05.2017 18:10+7Есть другое мнение.
По ГоMarwin
25.05.2017 18:09+2заранее извиняюсь, если скажу чушь применительно к стратегии игры в го, но что может противопоставить человек системе, у которой «перед глазами» тысячи и тысячи исходов партий с различными комбинациями зон влияния, которые в конечном итоге привели когда-то к выигрышу. И наверняка играющие ранее в те партии игроки даже могли не знать приведет ли их очередное решение к выигрышу или нет, поэтому и для текущей партии ход компа может показаться противнику нерациональным, однако комп-то знает, что в итоге это обернется ему благом.
Пусть это и не 100% математически верный расчет идеального хода как в шашках, но мысль остается сходной… у компа всё равно огромное преимущество по памяти предыдущих игр. Алгоритм, обучающий выбирать оптимальные шаги на их освное — пусть и сложное, но дело техники. Не сегодня так завтра…RuddyRudeman
25.05.2017 18:30+7Если бы преимущество определялось в основном количеством игр в памяти, то человек перестал бы побеждать у компьютера лет 30 назад. Однако в го за всю историю не было ни одной одинаковой партии (вероятно), а удачный ход при одном раскладе может оказаться причиной поражения при другом. Следовательно оценивать потенциальный ход нужно стратегически, продумывая очень абстрактные образы того, как он может повлиять сейчас или через 10 ходов с учетом положений остальных камней (или фигур). Вот в этом то люди и сильны, но до последнего не могли уловить, как этот навык оцифровать. И оказалось, что успешный формат оцифровки вовсе не в запоминании, а в нахождении взаимосвязей и паттернов.
ivlis
26.05.2017 00:16+1В этом и фишка Го, что её перебором вариантов не выиграть.
Bytamine
26.05.2017 13:18-2Это пока.
Закон Мура на стороне роботов.Aksiom
26.05.2017 13:50+2Закон Мура уже замедляется — надежда на альтернативные материалы.
В любом случае — полный перебор состояний го невозможен — количество возможных комбинаций намного больше, чем число атомов в наблюдаемой Вселенной. Хотя сейчас нет даже уверенности насчёт возможности полного перебора колоды из 52 игральных карт.roboq6
26.05.2017 16:22-1полный перебор состояний го невозможен
Мне кажется квантовые компьютеры дают надежду на полный перебор, не так ли?Aksiom
26.05.2017 18:04К сожалению, на этот вопрос у меня нет ответа, возможно, это так.
Тоже было бы интересно узнать!
br0x
31.05.2017 12:56Квантовые компьютеры если и помогут чем-то, то скоростью оценки конкретной позиции. А поскольку оцененные состояния надо где-то хранить, то все упрется в емкость памяти. Как было сказано выше, полный перебор Го выходит за все возможные в этой Вселенной рамки
roboq6
03.06.2017 09:48В любом случае — полный перебор состояний го невозможен
Для стандартной доски 19х19 — да.
Но вот для маленьких досок решение можно найти. Более того, го для доски 5х5 УЖЕ решён (http://erikvanderwerf.tengen.nl/5x5/5x5solved.html).Aksiom
03.06.2017 14:29Да, я имел в виду 19x19.
Интересно будет посмотреть, как будет развиваться ситуация с 9x9.
daiver19
26.05.2017 02:39+2Именно это собственно и делает AlphaGo, прорыв заключается в том, что, во-первых, раньше это никто толком не мог реализовать и, во-вторых, вместо какой-то базы данных с позициями она оперирует сверточными НС (aka «система распознавания образов»).
solariserj
25.05.2017 18:38+1Кто знает А почему не играет 5 партий как с ЛиСедолем, а только 3? Может за пять партий дал бы хоть одну победу.
impetus
25.05.2017 20:32-9Объективно это хорошо — цивилизация «востока» м.б. чуть меньше станет считать себя
богоизбрисключительной — «запад» сумел опять своими дьявольскими машинами победить их на самом «их» исконном поле… (что б там ни говорили дипломаты — китайцы ( и японцы) всех прочих людьми не считают — это увы факт)
Arxitektor
25.05.2017 21:50-1Вот интересно а в покер машина на этой технологии играть сможет?
И где больше вариантов и сложнее сама игра покер или ГО?BiTHacK
25.05.2017 22:07+2Покер и го слишком сильно различаются, чтобы их сравнивать. В покере есть неслабая часть психологии, которой лишена го. Да и стратегии в покере как таковой нет, просто вероятности.
slonofanya
25.05.2017 22:42+1Можно будет развивать и эту часть функционала, главное что бы у инвесторов интерес не пропал )
sumanai
25.05.2017 23:07+7В покере есть неслабая часть психологии, которой лишена го.
И у компьютера тут преимущество в виде непрошибаемого покерфейса.
ramzai
25.05.2017 23:08+3Недавно совсем было: Взять и победить: ИИ выиграл покерный турнир у четырех профи.
FirExpl
26.05.2017 08:55+3Мне одному кажется нечестным ограничение по времени в партиях человека с машиной? У машины гораздо больше мощностей, чем у человека, и тем не менее их ставят в «одинаковые» условия, которые по факту являются форой для машины, так как в конечном счёте человек оказывается в состоянии цейнтнота, что хорошо иллюстрирует вот эта фраза:
«Первые 100 ходов мы видели, пожалуй, лучшую игру из всех, что когда-либо проводились с Master-версией AlphaGo», — заявил глава DeepMind Демис Хассабис.
Hellsy22
26.05.2017 12:11+1У машины гораздо больше мощностей, чем у человека
А как вы сравнивали?FirExpl
26.05.2017 14:531) Энергопотребление у АльфаГо я подозреваю сильно выше чем у мозга.
2) Мощность — это количество работы за единицу времени. Предположим, что работа в данном контексте это поиск оптимального хода, и так же предположим, что пока человеку хватает времени, он делает примерно такие же по качеству ходы как и машина (а исходя из описаний партий такой вывод можно сделать). Как мы видим к ходу под номером N (например 100) у человека остаётся значительно меньше времени на ходы, и можно смело сделать вывод, что мощность мозга ниже. (по крайней мере в данной задаче)Hellsy22
27.05.2017 02:50Энергопотребление выше — это факт. Но это, как бы, скорее говорит о несовершенстве компьютеров, чем об их превосходстве. И я не согласен со сравнением качества — исходя из описания партии можно сделать вывод, что AlphaGo доминирует буквально с самого начала.
Пожалуй, я соглашусь, что ради спортивного интереса стоит ограничивать лишь время на ход, а в перспективе, когда AlphaGo продемонстрирует свое абсолютное превосходство даже в таких условиях — признать, что люди проиграли и начать думать в сторону урезания компьютеру времени или потребляемой энергии — не то, чтобы это поможет, скорее отодвинет проблему лет на 10, но может оказаться неплохой мотивацией к оптимизации.
demimurych
26.05.2017 16:50+2Даже сам факт того, что вы и многие другие, стали рассуждать с позиции — честно нечестно, говорит о невероятном прорыве подобных технологий.
Я напомню, что Го была последней игрой где считалось, что современный компьютер не может выиграть у человека в принципе.xPomaHx
27.05.2017 12:28Последней? Уверен что сейчас есть куча игр где комп слабее, не говоря о еще не придуманных играх.
Fedorchik
01.06.2017 08:52Слабее из-за того что эти игры как Неуловимый Джо. В случае с Го говорили именно о принципиальной невозможности победить человека.
roboq6
01.06.2017 11:48Кроме самой игры ещё важно сколько людей в неё играет.
Есть игра Arimaa, которая была специально создана таким образом чтобы компьютеру было трудно победить в ней. Был даже Arimaa Challenge с призом в $10 000 за первую победу ИИ на человеком, однако уже в 2015-ом году ИИ победил людей (http://www.kingpinchess.net/2015/07/arimaa-game-over/). Вполне допускаю мысль что это игра которая для ИИ тяжелей чем Го, но дело в том что сама игра довольно малопопулярна. Соответственно меньше шанс на появление самородков вроде Ли Седоля.
Kalashmatik
26.05.2017 14:35Интересно, а если две AlphaGo посадить играть друг против друга, будет ли победа вообще и насколько будет эффективно обучение при таком раскладе?
GlukKazan
26.05.2017 14:48Го — это такая игра, в которой ничьи большая редкость. Так что одна из AlphaGo обязательно выиграет.
А обучение у AlphaGo, по большей части, именно так и происходит.
ideological
27.05.2017 11:35А там реально какой-то алгоритм сложный или просто перебор всех возможных ходов?
Например в шахматах обычно готовятся «правильные ответы» на популярные ходы дебютов, а потом уже работает «перебор».
Если так, то называть это победой компьютера не совсем верно.
Возможно нужно ограничивать время на ход у компьютера, иначе какой-то дисбаланс :).sumanai
27.05.2017 12:31+1А там реально какой-то алгоритм сложный или просто перебор всех возможных ходов?
Перебор там невозможен.
Если так, то называть это победой компьютера не совсем верно.
А чем это называть? Люди тоже запоминают дебюты, и тоже перебирают в голове варианты.
KvanTTT
27.05.2017 14:50Например в шахматах обычно готовятся «правильные ответы» на популярные ходы дебютов, а потом уже работает «перебор».
Ну как бы метод Монте-Карло на дереьвях и повышает вероятность "правильных ответов" используя для этого перебор и информацию из нейросетей.
Shaco
Интересно, это только я упустил момент, когда в новости описываемая партия сменилась с первой на вторую?
Shaco
Я, конечно, понимаю, что редакторы на ГТ занятые люди, и написать в комментарии «поправил» слишком трудоёмко, но слов «в новом матче» в третьем абзаце не было в исходном тексте.
AllexIn
А что помешало вам отправить комментарий в личку для исправлений? Собственно поэтому всегда и говорят — исправления отправляйте в личку. Текст исправят, а ваш коммент останется висеть.