Разбор полетов во время игры от профессионалов
В первой игре матча по го компьютерная система AlphaGo, разработанная сотрудниками DeepMind, победила сильнейшего в мире игрока в го Кэ Цзе. Чемпион из Китая ранее заявлял, что считает возможным переиграть компьютер. Но пока что у него это не получилось сделать. Спустя четыре часа и 15 минут после старта матча 19-летний мастер го был вынужден признать поражение. Сейчас счет 1-0 в пользу компьютера.
Глава компании DeepMind заявил, что сейчас с чемпионом играла обновленная система, архитектура которой была существенно модифицирована. Благодаря этому AlphaGo постоянно учится, причем, в основном, обучение происходит при игре с собой же. Так что от информации по результатам матчей чемпионов-людей система сейчас зависит гораздо меньше. В теории, платформа от DeepMind может обучиться почти всему, далеко не только игре в го.
В январе этого года система AlphaGo сразилась с сильнейшими игроками в серии онлайн-матчей. Разработчики выбрали простой и понятный ник для своей системы — Master. Кстати, среди чемпионов го в этом январском онлайн-матче был и Кэ Цзе, его система тогда тоже переиграла, как и всех других мастеров го.
Сейчас платформа развивает успех, победив чемпиона в первом сражении без особых проблем. Конечно, простой эту игру назвать нельзя, но компьютер с выгодой для себя использует любую ошибку противника. Кэ Цзе в начале матча решил играть черными. Это, в противоположность шахматам, означает возможность сделать первый ход. Он начал уверенно, воспользовавшись стратегией «3–3 point», которую использовал и сам компьютер в январе. Это достаточно неожиданное начало, которое удивило бы и сбило с толку почти любого игрока-человека. Но AlphaGo — не человек, поэтому растерянности практически не было.
Разработчики, кстати, утверждают, что Цзе использовал многие стратегические находки компьютера, которые были зафиксированы на январском матче. «Он (Кэ Цзе, прим. ред.) использует большое количество ходов Master», — заявил комментатор матча Майкл Редмонд, рассказывая об особенностях игры чемпиона. Но это не помогло. Спустя всего три с половиной часа стало очевидно, что компьютер доминирует на игровом поле. Также явно было видно, что система играет еще лучше, чем во время матча с Ли Седолем.
Интересно, что после того, как AlphaGo начала побеждать всех и каждого в онлайн-чемпионате, победы человека уже мало кто ждал. Всего полгода назад уверенных в победе Цзэ было гораздо больше.
Разработчики системы говорят, что теперь она использует ресурсы гораздо эффективнее. Известно, что в сражении система задействовала в 10 раз меньше ресурсов, чем в матче с Ли Седолем. Основа AlphaGo — TPU, кастомный процессор от Google.
В матче перевес был небольшим — AlphaGo стала чемпионом лишь благодаря половине очка. Тем не менее, лидерство системы было, как и говорилось выше, очень заметно. В конце матча Цзэ начал делать несколько странные ходы, которые не давали ему никаких преимуществ. Возможно, это было сделано для того, чтобы выиграть время. Но все равно, к концу игры у чемпиона оставалось всего 13 минут на обдумывание своих ходов, а у ИИ оставалось около полутора часов в запасе.
Кэ Цзе, ранее обыгравший Седоля, заявлял, что выиграет. Но теперь его мнение изменилось. Почти сразу после матча он сказал, что больше не собирается играть в одиночку против ИИ.
А ведь еще совсем недавно считалось, что игра го для компьютера если и не не доступна, то очень сложна. Здесь нужно играть с достаточно высоким уровнем абстракции, предвидеть возможные ходы противника. При этом комбинаций ходов в го больше, чем число атомов во всей Вселенной.
Специалисты говорят, что та версия AlphaGo, которая играет сейчас с китайским чемпионом, может дать три камня форы той версии, что играла с Ли Седолем. Все эксперты, следившие за ходом игры Кэ Цзе, сходятся во мнении, что у него просто не было шансов против компьютера. Возможно, кстати, что перевес в половину очка — это лишь желание создателей AlphaGo добавить драматизма. Если бы система разбила чемпиона в пух и прах в первые же пару часов, то зрелища бы не получилось.
Сражение с Цзэ произошло на празднике го, который проходит с 23 по 27 мая в Китае, городе Вужень, провинция Чжэцян. Alpha Go играет не против одного человека, а участвует в нескольких этапах соревнований, включая такие:
- «Парное Go» — игра, где один из чемпионов го из Китая будет играть против другого… Все традиционно, кроме того, что у обоих будет собственный напарник AlphaGo. Ожидается, что в таком формате компьютер и человек смогут учиться друг у друга;
- «Командное Go» — соревнование в котором пять профи будет играть против AlphaGo. Профессионалы попытаются выиграть у системы, изучив особенности ее игры. Им разрешено обсуждать ходы между собой. В команду входят, помимо компьютера, Ши Юэ, Чен Яое, Ми Ютинг, Танг Вейхинг и Чжоу Руянг;
- «Кэ Цзе против AlphaGo» — пожалуй, центральный элемент всего праздника го. В нем сразятся два чемпиона — компьютер и человек.
Кэ Цзе считает, что компьютерные технологии игры в го будут совершенствоваться, поэтому в будущем смысла сражаться с компьютером просто нет — машина будет побеждать.
С ним согласен и один из профессиональных игроков го Южной Кореи Мок Чинсока: «Мы ждем еще 2 и 3 партию матча AlphaGo с Кэ Цзе, но, вероятно, Ли Седоль станет последним человеком на Земле, кому удалось обыграть AlphaGo».
Только зарегистрированные пользователи могут участвовать в опросе. Войдите, пожалуйста.
Комментарии (95)
knstqq
24.05.2017 15:25+6>> Считаете ли вы, что у AlphaGo невозможно выиграть в го?
Да, разумеется, ведь в сражении двух копий AlphaGo обязательно победит один.tmin10
24.05.2017 20:37-3Возможно постоянная ничья, когда закончится поле, а если оно бесконечно, то возможна бесконечная игра…
GreenGoblin
24.05.2017 22:00+1Совсем не обязательно. Ничьих в го не бывает, но в некоторых забавных случаях (вроде тройного ко) игра признается несостоявшейся. Достаточно сильный ИИ, вероятно, сможет такое инициировать намеренно. Так же, как шахматисты сводят три четверти игр к ничьей/пату/вечному шаху или чему-нибудь еще.
ilansk
24.05.2017 15:26+2- Ке Дзе играл Черными, которые ходят в Го первыми, но это не дает перевеса (как в шахматах) т.к. белым начисляют компенсацию в 7.5 очков (Комми).
- К середине игры компьютер имел перевес в ~7,5 очков, но растерял их к концу игры победив с ничтожным перевесом в 1.5 очка.
knstqq
24.05.2017 16:48ничтожным??? Это у любителей перевес в 1.5 очка ничтожный, потому что обычно разрыв очков в 10-20-100.
Если же это профи, то нормальный разрыв 0.5-8.5 очков
yea
24.05.2017 17:01+6Во время игр с Ли Седолем где-то упоминалось, что приоритет Альфа Го — не максимизация преимущества, а его удержание. То бишь, при наличии перевеса по очкам эта штуковина не стремится его увеличить, а начинает делать максимально безопасные ходы.
QDeathNick
24.05.2017 15:41+4Выбрал 4 вариант, так как считаю что у AlphaGo возможно выиграть в го, но надо создать подходящий ИИ и имплантировать имплант Ке Дзе.
Rampages
25.05.2017 03:03Что-то в вашем предложении смысл не сразу понял :) показалось, что это Ке Дзе надо имплантировать в ИИ, а не наоборот.
Nihonjin
24.05.2017 16:26Думается мне основная проблема тут, в том что игроки в го просто не приучены играть против компьютера. Возможно что при подборе правильной стратегии выиграть у компьютере на данном этапе все же можно, но тут надо будет учитывать особенности алгоритма лежащего в основе AlphaGo.
yea
24.05.2017 17:03+7Думается мне, что это слишком оптимистичная по отношению к мясным человекам точка зрения. В шахматы, например, у любой достойной программы человек уже лет пятнадцать как выиграть не может в принципе, сколько бы он там ни учился.
Nihonjin
24.05.2017 17:26Так и вычислительная сложность у шахмат куда ниже, да и перед тем как компьютеры начали обыгрывать профессиональных игроков в 100% случаев у них (игроков) было время потренироваться на более слабых ботах. Тут же переход от «лучшие боты не могут обыграть даже среднего игрока» до «человеку больше никогда не обыграть компьютер» произошел слишком быстро. Возможно что у нас все еще есть несколько лет до того момента как программы типа AlphaGo станут по настоящему непобедимы. Впрочем, я могу и ошибаться.
vmchaz
24.05.2017 18:30+1Читал такое мнение, что большинство игроков в Го отсеивается перед каким-то уровнем мастерства, и что дальше идут те, кто учится «видеть» игровое поле как-то по-новому.
Может быть в связях AlphaGo в процессе постоянных тренировок со своими копиями возникло некоторое подобие подобного «видения».unclejocker
25.05.2017 14:24Не может быть, а так и было задумано. Перебором позиций Го не решается, соответственно сеть натаскали оценивать позицию «на глаз».
river-fall
24.05.2017 19:24-2экспоненциальный рост производительности в действии.
Скачок искуственного интеллекта от «деревенского дурачка» до «суммарный интеллект всего человечества» будет тоже весьма быстрым.
ГрафикLynXzp
24.05.2017 19:54+4Строго говоря на графике даже интерполяция хромает (начало приопущено, конец приподнят чтобы увеличить наклон). А про экстраполяцию вообще нет смысла говорить.
solariserj
25.05.2017 10:29Мне кажется что пока еще можно выиграть у него, но это будут случайные выигрыши, после матча с Седолем я предсказывал что через 5 лет Компьютер будет уверенно выигрывать на 9 камнях форы, но сейчас мне кажется что это будет бысьтрее. Хотя 5 лет назад никто не сомневался в превосходстве человека в Игре Го, то теперь этот бастион пал. Будущее уже здесь. Шашки уже полностью просчитаны, шахматы все эндшпили тоже, что там еще осталось? Алгоритмы будут создаваться и совершенствоваться и это показывает торжество разума.
GlukKazan
25.05.2017 10:49Этот миф с шашками уже начинает утомлять. Полностью (из исходной позиции) просчитаны Checkers (Английские шашки). Международные, Русские, Фризские, Тайские, Турецкие и прочие шашки никто не «просчитывал». Я не к тому, что это невозможно. Просто этим никто вроде бы не занимался (поправьте, если я ошибаюсь). И кстати, все перечисленные мной разновидности шашек сильно сложнее английских, с их тихоходными дамками.
solariserj
25.05.2017 13:38Я не вдавался в подробности когда услышал. Какие там шашки были, а просто принял что человек компьютеру эту игру проиграл, и понял что это возможно, Далее только остаётся выстроить ряд игр по сложности и компьютер будет их щёлкать одну за другой.
GlukKazan
25.05.2017 14:03Человек компьютеру проигрывает постоянно и это почти ничего не значит. С шашками суть в другом. Их полностью просчитали от начальной позиции, в том смысле, что в каждой из последующих позиций нашли наилучший ход, но, опять же, 1 — не из любой позиции, 2 — только для очень простого варианта шашек. Выстроить игры по сложности тоже довольно проблематично. Ну и, кроме того, мне совсем непонятно — зачем?
dom1n1k
25.05.2017 02:16+1Даже если будет найдена (случайно или целенаправленно) такая стратегия, которая нащупает некие слабые места реализации — очевидно, что она станет одноразовой. В следующей версии слабость пофиксят, да и всё.
lega
24.05.2017 18:40-2Обыгрыю AlphaGo с 9 камнями форы :)
Regis
24.05.2017 21:01+6Что-то сомневаюсь. Подозреваю, что даже на таких условиях против AlphaGo требуется как минимум профессиональный уровень игры.
GreenGoblin
25.05.2017 14:50+1Термин «профессионал» в го означает примерно то же, что в шахматах значит гроссмейстер. Если альфаго сейчас на пару камней сильнее чемпиона, то играть на 9 камнях с ним могут любители уровня 3-5 дана.
Regis
26.05.2017 13:14Так вот, сомнения как раз в том, что у lega есть соответствующий уровень.
lega
26.05.2017 18:02-1Да, такого высого уровня нет, но я считаю что камни дают перевес не арифметический (как считается), а экспонециально.
И 9 камней — это не просто фора, это значит, что поле уже «занято» изначально, и захватывать уже не надо, только укрепиться, а это уже другой стиль игры (в добавок AlphaGo может быть просто не готов к такому).
Надеюсь вы не будете утверждать что самый новичек (1 день в го) проиграет AlphaGo с форой в 85 правильно стоящих камней, т.к. это будет выигрышь с 1-го хода (захват 51% поля), в половину этого (~40 каменей), новичку будет легко обыграть — достаточно будет соединить камни стоящие через один ну и короткая инструкция от нападок, далее половина от этого (~20 камней), камни стоят на 2 и 3 друг от друга, уже нужен уровень повыше, но все равно не сложно, просто соединить «сетку». Половина от того (~10), я бы попробовал, если бы была возможность с ним сразиться.Nihonjin
27.05.2017 01:12+4Вы видимо очень плохо понимаете как работает фора в го. Сомневаюсь что за пределами восточной Азии наберется хоть десяток игроков способных обыграть AlphaGo с 9 камнями форы, не говоря уже про каких-то любителей. Я сомневаюсь что даже с 20 у вас был бы шанс (хотя утверждать не могу, так как вашевого уровня я не знаю). Фора много дает только лишь при очень высоком профессиональном уровне владения игрой. Если вы не осилили даже 1-й любительский дан по Европейской классификации (который соответствует ~8кю азиатскому), то тут даже и спорить особо не о чем.
Illivion
24.05.2017 19:40-2Интересно, как бы сыграл AlphaGo против другого AlphaGo
GlukKazan
24.05.2017 19:57+12Он это постоянно делает
gxcreator
25.05.2017 12:55И как результаты?
GlukKazan
25.05.2017 13:09+2Разве это не заметно? С прошлых игр с Ли Седолем AlphaGo стал играть еще лучше.
Aksiom
25.05.2017 13:23Намного лучше! После игр с Ли Седолем AlphaGo играл онлайн, и победил в 60 играх подряд (версия «Мастер»). Deepmind сообщили, что Мастер был сильнее на 3 камня той версии, которая играла с Ли. Текущая версия считается ещё сильнее.
xPomaHx
24.05.2017 20:23-1Эпоха такая, что умные люди идут разрабатывать ИИ, а другие играть в настольные игры, соответственно умные выигрывают.
ankh1989
25.05.2017 05:59+1Этот Ке Цзе наверняка даст фору всем разработчикам АльфаГо в плане интеллекта, но это не значит, что он сможет обыграть их программу.
zim32
24.05.2017 21:50Все равно люди будут играть и будут смотреть, потому что эмоции, адреналин, ошибки. А смотреть как одна байтодробилка играет с другой, ну возможно кому-то это и интересно, но большинству думаю нет.
QWhisper
25.05.2017 05:42А в чем принципиальное отличие «байтодробилка против байтодробилки» и «мешок с мясом против мешка с мясом»?
Welran
25.05.2017 06:35+1Тем что зрители это тоже «мешки с мясом». Возможно в будущем один АИ будет говорить другому: «Представляешь, UXL56-TY6-Y наблюдает матч по го среди людей. Как вообще можно смотреть столь нелепые соревнования, даже я могу обыграть любого из них используя всего 0.00217% своей мощности.»
amarao
25.05.2017 11:02+1Петушиные бои смотрят не потому, что человек не может петуха обороть, а потому что забавно.
zagayevskiy
25.05.2017 14:06Тем что мы до сих пор не знаем, как именно играют игроки уровня Ли Седоля?
NightGhost
25.05.2017 14:52-1Потому что мешки мяса умеют думать, и могут примерно предполагать, как думают/размышляют другие мешки мяса. Даже пример с петухами укладывается в эту модель – мы можем хотя бы попытаться представить, что происходит у петуха в голове, почему он сделал тот или иной ход (испугался ли, увидел ли страх противника, неуверенность и т.п.).
Понимания как «размышляют» компьютеры у нас нет. Есть там какой-то процессор, какой-то алгоритм, он что-то просчитывает, никаких эмоций, ничего лишнего. Скука.
raid
24.05.2017 22:51+1Надо ограничить вычислительные ресурсы, доступные системе. Интересно будет.
pronvit
25.05.2017 05:09Именно. Потому что это все интересно, если это достижения в алгоритмической сфере. А иначе при возможности неограниченного масштабирования ясно дело компьютер окажется сильнее одного мозга в любой игре с полной информацией.
ankh1989
25.05.2017 06:02Не окажется. Сложность таких программ в том, что они не масштабируются: от того, что вы запустите GnuGo на кластере из миллиона процессоров он не станет играть в миллион раз сильнее.
pronvit
25.05.2017 07:44Почему? Я не знаю, что там у GnuGo, но это же перебор дерева ходов.
The version of AlphaGo that played against Lee used a similar amount of computing power as in the match against Fan Hui, where it used 1,202 CPUs and 176 GPUs. The Economist reported that it used 1,920 CPUs and 280 GPUs.
И в AlphaGo это как был перебор, так и остался, просто со всякими хитростями для сужения поиска. Но всегда можно накинуть процессоров для достижения желаемого результата, что не очень интересно.red75prim
25.05.2017 08:17+2И в AlphaGo это как был перебор, так и остался, просто со всякими хитростями для сужения поиска.
Глубина поиска 50 ходов, количество анализируемых позиций 10000, коэфициент сокращения пространства поиска порядка 200 в 50-й степени.
Честно говоря, с такими масштабами сокращения пространства поиска фразу "как был перебор так и остался" можно применить и к шахматисту, перебирающему десятки позиций.
ankh1989
26.05.2017 19:54Допустим есть программа которая делает полный перебор. Пусть в среднем у нас 50 возможных ходов каждый раз. Тогда после 1-го хода у нас будет 50 вариантов, после 2-го будет уже 50^2 и т.д. Если 1000 процессоров позволяют перебирать на 5 ходов в глубину, то чтобы перебирать на 6 ходов в глубину нам надо уже 50,000 процессоров, при условии, что алгоритм идеально распараллеливается (а он как раз не распаралелливается).
KvanTTT
27.05.2017 14:56Вообще-то распарралеливается, но идеально — перебор то там случайный. Более того, с большей глубиной становится больше одинаковых позиций.
Falcon_peregrinus
25.05.2017 05:29Но все равно, к концу игры у чемпиона оставалось всего 13 минут на обдумывание своих ходов, а у ИИ оставалось около полутора часов в запасе.
И чтобы вот такого не было. Ясно же, что у компьютера значительно больше мощностей. Либо убирать время, либо считать его для компьютера по другому.
red75prim
25.05.2017 07:35+1По сравнению с матчем с Ли Седолем вычислительные ресурсы и так урезали в 10 раз (https://www.reddit.com/r/baduk/comments/6cza2t/david_silver_reveals_new_details_of_alphago/). Кроме того, зачем выдумывать какие-то свои правила, когда в го принято давать фору в несколько камней слабейшему игроку.
zagayevskiy
25.05.2017 14:11Так он заведомо сильнейшим считается? Это как-то немного унизительно для чемпиона. А вот пусть они запихнут это в мешок (как тут любят выражаться) с электроникой — размером, ну, хотя бы с человека.
red75prim
25.05.2017 15:00+1Если верить комментарию, который я привёл, то уже. Используется 5 модулей TPU (размером с ладонь), установленных в одном компьютере.
Jamdaze
25.05.2017 07:35+2Почему формат игры такой же как если бы человек играл против человека? Известно ли хотябы приблизительно против какого физического объекта он играл, сколько электричества потреблял АльфаГо во время игры?
ankh1989
26.05.2017 19:56+1Чего все так грузяться электричеством? Зато альфаго не пил и не ел. Давайте запретим человекам есть тогда.
Jamdaze
27.05.2017 10:35Может против одного человека поставили целый дата-центр, с потреблением несколько мегаватт? Это больше шоу чем честное состязание, совершенно невозможно проверить против кого\чего играл человек.
С одной стороны — реальный человек, ему никто не советует, он все решения принимает сам. А проти него — непойми что.KvanTTT
27.05.2017 14:59Да хоть 100 дата-центров — количество ходов растет экспоненциально, так что все варианты все равно не просчитать. Так что алгоритмы играют большую роль. Более того, в этом матче программу оптимизировали так, что она стала потреблять в 10 раз меньше мощностей.
hp6812er
25.05.2017 08:20Какая перспектива этой наработки от Гугл? Чему ещё эффективно сможет научиться эта система? Или как по аналогии с Дип Блю, сможет побеждать только в
шахматыв Го?red75prim
25.05.2017 08:32+2Скорее всего сможет побеждать людей в любой детерминированной игре с полной информацией. Нужно будет только прогнать циклы обучения на примерах, а потом циклы самообучения.
Следующая версия, играющая в Старкрафт, будет интереснее. Она будет расчитана на игры в реальном времени с неполной информацией. Ещё добавить систему планирования движений, интегрированную с распознаванием изображений и можно отправлять на поле боя.
hp6812er
25.05.2017 08:45Мне тоже кажется, что практическая составляющая пока только «proof of concept». Хотя впечатляет возможность решения задач, аналитически нерешаемых.
mukizu
25.05.2017 13:30Почитайте чем сейчас Ватсон занимается, например. Медицина та же самая.
hp6812er
25.05.2017 13:51Давно слежу за новостями от IBM и их когнитивном детище. Но, к сожалению, дальше теоретического пиара они не продвинулись. Практические решения бесплатные или коммерческие отсутствует на рынке.
Всё жду, когда появится их софт, который сможет по снимкам проверить / поставить диагноз… Но пока всё теория.mukizu
25.05.2017 21:55https://www-03.ibm.com/press/us/en/pressrelease/48189.wss
https://www.theguardian.com/technology/2017/jan/05/japanese-company-replaces-office-workers-artificial-intelligence-ai-fukoku-mutual-life-insurance
Каких решений вы ждете? App для телефона, который по вашей медкнижке вам диагноз поставит и рецепт выпишет?
vasiliysenin
25.05.2017 13:29Компьютер не ошибается, а человек может ошибиться. Поэтому при игре против компьютера надо разрешить отменять ходы.
LynXzp
25.05.2017 16:54+1Deep blue ошибся.
solariserj
25.05.2017 19:39+1Только Каспарову это не помогло :(
LynXzp
25.05.2017 19:42Там была ирония. А может и помогло — ему бы потом все равно предложили матч-реванш, меньше «мучился».
OlegZH
25.05.2017 15:50Разработчики системы говорят, что теперь она использует ресурсы гораздо эффективнее.
А мне интересно, что будет, если использовать программу типа AlphaGo для управления ресурсами компьютера (вроде операционной системы)? Чтобы она сама искала оптимальные способы управления памятью и оптимальные же способы представления информации.
P.S. Что будет (теперь) дальше? Genisys?
braineater
Странные выводы. Играть можно не только ради победы, но и ради опыта. У сильного игрока можно учиться, изучать стратегию, набивать руку. Можно устраивать чемпионаты, где люди играют против АльфаГо но соревнуются друг с другом, кто покажет лучший результат в игре против машины тот и победил. Если АльфаГо действительно так сильна что человеку выиграть у нее никак нельзя, то игроков в го ждет новый уровень, и профессионалов, КМК, это должно радовать а не пугать.
samodum
А опыт тогда для чего развивать?
t13s
Автомобили тоже быстрее людей передвигаются.
Так что все беговые спортивные соревнования предлагаю отменить как бесперспективные.
TRYFAN
Вы предлагаете соревноваться в беге с автомобилем.
GlukKazan
Вообще-то, играют далеко не всегда чтобы выиграть. Некоторые играют для удовольствия.
Ну и тренировку с компьютером на форе никто не отменял.
roboq6
Чтобы побеждать. Но не компьютер, а человеков.
Camrad_RIP
Это нормально. Велосипеды не соревнуются с мотоциклами. А играт против ИИ он конечно будет. Запустит на моьилке и будет играть, для тренировки.
zagayevskiy
Эту штуковину нельзя "запустить на мобилке". По факту там играет один мозг против целого ДЦ.
Thero
это пока нельзя… в следующих чипах квалкома будет тензорный сопроцессор для вот этих вот нейросеточек… ограниченную версию и запустить можно будет
roboq6
На мобилке можно поместить клиент, а сам AlphaGo будет работать в облаке
lazywicked
шахматисты уже не играют, так как это просто избиение, не надо соревноваться в скорости с машиной