Как решить «Сапёра» (и сделать его лучше) / forpes.ru

Главная
Как решить «Сапёра» (и сделать его лучше)

Как решить «Сапёра» (и сделать его лучше) +28

28.05.2019 12:55

PatientZero 16 9100 Источник

«Сапёр» (Minesweeper) — это простая игра с простыми правилами, однако некоторые её конфигурации создают любопытные трудности. В этой статье мы создадим солвер «Сапёра» с увеличивающейся сложностью, и поразмышляем над тем, как меняется динамика игры при постепенном повышении уровня помощи. В конце мы разработаем новый вариант игры с гораздо более интересным геймплеем.

Локальные рассуждения: ноль соседних мин

В оригинальной игре используется один автоматический механизм: когда игрок открывает клетку, рядом с которой нет мин, движок игры открывает все соседние клетки. Это ничем не угрожает игре, поэтому можно спокойно позволить компьютеру это сделать, а сама ситуация сразу же понятна игроку и никак не мешает геймплею.

Такое рассуждение совершенно локально: для принятия решения о следующем действии учитывается информация только одной клетки.

Сложно придумать ситуацию, в которой игра стала бы хуже без этой автоматической помощи. Попробуйте сыграть в такую игру, чтобы получить представление о том, как она проходит без автоматического открытия клеток [в оригинале статьи все примеры интерактивны]:

Локальные рассуждения с учётом окружения

Новому игроку несложно будет понять, что если количество соседних мин, то есть число, показанное в клетке, равно количеству неоткрытых соседних клеток, то все эти клетки должны быть минами, поэтому на них надо поставить флажки. Аналогично, когда количество соседних мин равно количеству соседних флагов, то оставшиеся неоткрытыми соседние клетки должны быть пусты.

В этих правилах учитывается одна клетка, а также состояние соседних (открыты/поставлен флажок).

Реализация этих правил вручную может быть увлекательной. Если добавить таймер, то игрок начинает учиться применять их быстро и точно. Это превращает «Сапёра» в игру на реакцию. Что произойдёт, если мы автоматизируем эти правила?

У подобной автоматизации есть интересный побочный эффект — установка флажка может мгновенно иметь фатальные последствия.

В остальном у нас могут возникнуть ситуации, которые можно разбить на три категории:

Игры, полностью разрешаемые применением автоматических правил
Сложные ситуации, требующие для рассуждений большего количества клеток
Состояния игры, в которых нет логического пути вперёд — игроку остаётся только выбирать случайно, возможно с учётом вероятностей.

Ситуация 1 кажется красивой, но не особо интересной, если будет возникать слишком часто. Будут ли такие игры лучше без автоматического решения? Может быть и нет; такие игры очень просты даже при решении вручную, и игроку не особо интересно играть в игры, в которых нет трудностей. Хотя, разумеется, в игре на реакцию сложность есть всегда: нужно действовать как можно быстрее.

Очень привлекательной мне кажется ситуация 2. Мы больше сосредотачиваемся на решении логических условий, меньше тратя время на точное прицеливание и нажимание правильных кнопок. Это делает «Сапёра» больше похожим на активную головоломку.

Ситуация 3 полностью разрушает всю увлекательность. Впрочем, я слышал, что некоторым людям нравится играть в игры со случайностью.

Можно ли избавиться от ситуации 3?

Полное решение: глобальные рассуждения

Для алгоритмического обнаружения всех необходимых для состояния игры логических условий нам нужно выполнить исчерпывающий поиск всех состояний игры. Доказано, что Minesweeper — это NP-полная задача. Ниже показан небольшой, но интересный и наглядный пример состояния игры, имеющий всего одно логическое решение, но для его нахождения необходимо учитывать состояние игры целиком:

Возможно ли выполнить поиск по всему пространству состояний игры? Сколько всего существует вариантов состояний s?

Дано:

w = ширина поля

h = высота поля

k = количество мин

n = w · h

Тогда количество возможных состояний s равно

$s = \begin{pmatrix} n\\ k \end{pmatrix}$

Для стандартных уровней «Новичок», «Любитель» и «Профессионал» это даёт нам:

$s_b = \begin{pmatrix} 8*8\\ 10 \end{pmatrix} = 151473214816$

$s_i = \begin{pmatrix} 16*16\\ 40 \end{pmatrix} = 1.050 * 10^{47}$

$s_e = \begin{pmatrix} 30*16\\ 99 \end{pmatrix} = 5.602 * 10^{104}$

Мы понимаем, что наивный подход здесь совершенно не подходит. Давайте посмотрим, как бы мог выглядеть наивный алгоритм, и узнаем, можно ли его оптимизировать в нечто работающее.

Наивный алгоритм

Задача алгоритма — найти все необходимые для заданного состояния поля логические условия. Было бы сложно реализовать это тщательным продумыванием решений; компьютер гораздо лучше справляется с быстрым выполнением кучи глупых действий.

Что мы можем сделать «глупого»: сгенерировать все возможные перестановки позиций мин для всех оставшихся мин. Если такая перестановка соответствует всем открытым числам, то она будет правильным решением игры. Затем мы изучаем все возможные перестановки, находим все возможные решения, но по-прежнему не знаем, какое из них является верным.

Если во всех возможных решениях есть что-то общее, или среди открытых клеток, или среди клеток, помеченных как мины, то мы понимаем, что это общее должно быть частью верного решения для текущего поля. И в самом деле: невозможно создать верного решения, не имеющего таких совпадающих элементов, иначе бы мы их обнаружили.

Таким образом мы можем найти все необходимые для текущего состояния поля логические условия.

Клетки с ограничениями и без ограничений

У приведённого выше алгоритма есть очевидная проблема: количество состояний, которое ему нужно исследовать. Но не все клетки одинаковы. Неоткрытые клетки, находящиеся рядом с числом, очевидно ограничены этим числом. Мы назовём эти клетки ограниченными. Оставшиеся клетки мы назовём неограниченными.

Если мы реализуем приведённый выше алгоритм, но будем выполнять поиск только в пространстве состояний ограниченных клеток, и будем возвращаться назад, как только нарушим ограничение, то во многих играх сможем решить все логические условия за разумный промежуток времени:

В случае неограниченных клеток мы никак не можем узнать, где расположены мины, и логически сразу знаем об этом. Это означает, что можно исключить их из вычисления и рассматривать только расположение мин рядом с открытыми числами.

Однако мы знаем, что некое количество мин может попасть во множество неограниченных клеток; если есть 6 мин и 4 ограниченных клетки, то в ограниченных клетках может быть максимум 4 мины, то есть не менее 2 мин должно находиться в неограниченных клетках. По аналогичной логике мы иногда можем определить, что все неограниченные клетки должны быть пустыми или все содержать мины.

В показанном ниже случае мы знаем позиции всех мин, поэтому ИИ должен быть способен понять, что оставшиеся ячейки не заняты:

В следующем случае мы не знаем позиций всех мин, но можем понять, что оставшуюся мину нужно поместить в одну из двух клеток слева вверху. Это значит, что оставшаяся в правом нижнем углу клетка свободна:

Версия со случайностью

Если мы автоматически будем запускать глобальный солвер, то получим оптимизированную по случайности версию «Сапёра»:

Можно разделить игры в этой версии на три категории:

Игры, в которых игрок делает произвольный выбор и выигрывает.
Игры, в которых игрок делает произвольный выбор и проигрывает.
Игры, в которых работа ИИ требует много времени, и игрок на самом деле может использовать рассуждения.

Очевидно, что это игра со случайностями. В чём же привлекательность таких игр? С точки зрения логики показанная выше игра схожа с такой:

Но какая из игр со случайностями лучше? Похоже, что смысл других игр со случайностями заключается в существовании сложной связи между действиями игрока и победой/проигрышем. Для вытягивания номеров лотереи используются сложные машины, которые специально не торопятся в выборе номера и делают из показа этого номера целое шоу.

Возможно, большое поле, которое решается автоматически, является довольно хорошей игрой
со случайностями, учитывая то, что игрок наблюдает за постепенным открыванием всех клеток.

Можем ли мы придумать другой тип игры?

Детерминированная версия

Теперь у нас есть ИИ, способный определять все логичные шаги из заданного состояния игры. Иногда он не сможет находит логичных шагов. В таких ситуациях игроку приходится угадывать и он может проиграть, если ему не повезёт.

Что если мы добавим ещё одно правило? Когда у игры нет логичного пути вперёд, то мы можем попросить о помощи. Если ИИ соглашается, что игрок не может ничего поделать, то приходит ему на помощь. В противном случае игрок немедленно проигрывает. Это может быть интересным. Какой может быть такая помощь? Возможно, нужно открыть одну клетку, вне зависимости от наличия в ней мины:

Таким образом, мы полностью избавились от ситуаций, в которых можно было проиграть случайно.

Однако тут есть одно исключение: по-прежнему существует вероятность вырожденных ситуаций, в которых глобальный солвер не может закончить вычисления за разумный промежуток времени. К сожалению, это неизбежный результат того, что задача «Сапёра» NP-полная.

Как кнопка «Попросить помощи» влияет на игровой процесс? Она приводит тому, что игра больше сосредотачивается на логике; это самый «головоломный» вариант «Сапёра». Кто-то может подумать, что игра станет проще, но на самом деле она усложняется. Теперь ошибкам игрока нет оправданий, и кнопка накажет его, если он что-то упустил. Без кнопки легко прийти к выводу, что ты исчерпал все логичные возможности и единственный вариант развития событий — попытаться угадать случайным образом. Но из-за существования кнопки игрок обязан быть прав в этой оценке.

В заключение

Реализовав полный солвер «Сапёра», мы смогли создать разновидность игры, избавленной от её проклятья: теперь невозможно проиграть из-за того, что приходится выбирать случайно, когда уже почти решил всё поле. Эта версия отличается от оригинальной игры только в те моменты, когда нужно угадывать случайным образом, поэтому могу предположить, что она намного увлекательнее, чем оригинальная игра.

Кроме того, мы разработали вариант игры, автоматически решающий простые локальные правила. Стоит ли использовать такую помощь — зависит только от вас. Она смещает фокус игры с механического щёлканья к более головоломному игровому процессу. При этом необязательно пользоваться усовершенствованием геймплея, которое обеспечивает кнопка «Попросить помощи».

Комментарии (16)

Mingun
28.05.2019 16:59
#20212302
У меня было несколько идей в том же направлении, что и у автора:
- в случае захода в логические тупики (случай 3), вычислять для клеток вероятность выигрыша, если открыть именно ее
- посчитать вероятность подорваться на мине на кратчайшем наибезопаснейшем пути между двумя точками. В идеале нужно найти безопасный путь, но если солвер захотит в тупик (случай 3), то нужно найти наиболее безопасный
- найти этот путь

amarao
28.05.2019 17:03
#20212340
+1
Мне кажется, что поле надо просто подбирать таким образом, чтобы оно было решаемо.

Потому что когда в финале такая картинка (утрирую, поле 3х3):
```
___
121
???
```
То скучно играть в рулетку.
1. Miss_Rita
  28.05.2019 18:08
  #20212734
  +1
  Но ведь в данном случае не рулетка.
  
  000
  121
  *2*
  
  получится, по-другому никак. При условии, что верхние прочерки — это нули или не важные нам в данном случае цифры.
  1. dopusteam
    28.05.2019 18:26
    #20212832
    ? 1
    1?
    
    А если так?
    
    Miss_Rita
    28.05.2019 18:32
    #20212864
    Поэтому я и написала про данный случай.
    Конечно такие моменты бывают. Но приведенный выше пример — не в их числе)
    
    dopusteam
    28.05.2019 18:35
    #20212872
    Это да, не заметил, показалось что опять 'в интернете кто то не прав')
    
    Gaku
    31.05.2019 12:04
    #20226354
    В таком случае есть возможность поставить флажок на любое закрытое поле.
    Цель игры — определить, где расположены мины, а не открыть все поля. В таком случае перебор всех возможных вариантов предсталяет собой единственный 100% беспроигрышный вариант прохождения.
  1. amarao
    29.05.2019 09:27
    #20214984
    А, пардон. Трудно в обратную сторону придумывать, но вы поняли. Такие моменты бывают — когда вероятности для двух клеток одинаковы и нет никаких других подсказок.
1. mfedko
  28.05.2019 18:33
  #20212868
  центральная же не может быть миной?

FGV
28.05.2019 18:28
#20212840
Хех, сапер :)
Когда то писал подобный, тока не с автоматизацией открытия, а с подсказками — поля с гарантированными/отсутствующими минами помечались. Дальше уж как игрок стилусом в кпк ткнет.

legolegs
29.05.2019 12:23
#20216086
Новому игроку несложно будет понять, что если количество соседних мин, то есть число, показанное в клетке, равно количеству неоткрытых соседних клеток, то все эти клетки должны быть минами, поэтому на них надо поставить флажки. Аналогично, когда количество соседних мин равно количеству соседних флагов, то оставшиеся неоткрытыми соседние клетки должны быть пусты.

Собственно пока игрок с этим разбирается ему интересно, после происходит одно из трёх:
1. Игрок теряет интерес к сапёру
2. Игрок играет на скорость, выполняя тот же самый несложный алгоритм
3. Игрок программист и начинает выдумывать решалки и ИИ для сапёра.
1. Slavik_Kenny
  29.05.2019 13:51
  #20216648
  Именно так… Я из второй категории :)
  
  Улучшить так и не удалось :(

Tortortor
29.05.2019 16:26
#20217706
ситуацию на КДПВ можно доиграть без угадывания.
1. TheShock
  29.05.2019 19:39
  #20218702
  +2
  Как минимум в этих 4 — точно нету мины
  1. TheShock
    29.05.2019 19:44
    #20218714
    А дальше — зависимо от значения зеленой
    
    Если там двойка — значит мина в фиолетовой.
    Если единица — в оранжевой.
    
    Если мина в фиолетовой, то вторая мина — в синей, иначе — в голубой.

speshuric
30.05.2019 00:59
#20219724
Несмотря на то что в статье даже упомянута NP-полнота, главная проблема статьи — решение локальной проблемы без математического взгляда на неё.
На самом деле решение сапёра не надо выводить из перебора и локальных правил, а наоборот, проще сформулировать и проанализировать саму задачу. В каждый момент времени игровое поле (открытые клетки с числами мин вокруг, закрытые и помеченные) представляет собой достаточно простую систему линейных уравнений (СЛАУ).
- Каждая закрытая клетка — переменная x[i], которая может принимать значение 0 — нет мины, или 1 — есть мина.
- Общее количество мин известно — N — вот у нас первое уравнение sum(x[i])=N
- Каждая открытая клетка с нераскрытыми и непомеченными — ещё одно уравнение. Если в такой клетке указано, что вокруг a[j] мин, то для соседних x[i(j)] будет уравнение sum(x[i(j)])=a[j]
- Помеченные клетки проще всего вычитать из соседних открытых.
- Общее количество переменных не превышает количества клеток поля. Посмотрел сейчас — это всего 16*30=480 в режиме "Эксперт". Ну право же — даже банальным Гауссом можно чуть ли не на порядок большие СЛАУ решать. Но тут Гаусс почти не нужен, потому что...
- … СЛАУ разреженная. В ней только одно уравнение со всеми переменными с коэффициентами 1. Все остальные — не более 8 переменных с коэффициентами 1.
- А еще упрощает, что нам не нужно искать пространство решений, а достаточно найти точное значение только одной из переменных x[i]: если в этой переменной 0, то у нас появляется новое уравнение, а если 1, то одно уравнение становится проще.
- А если даже ни одно точное решение переменных не найдено, то из коэффициентов СЛАУ можно достаточно легко можно получить значения для сравнения вероятности того, что там бомба.
Реально даже в середине игры будет получаться СЛАУ не более чем из 50 уравнений. Причем с кучей возможности оптимизаций (разреженная, коэффициенты 0 или 1, значения переменных допустимы только 0 и 1, свободные члены все кроме одного в 1..8, все уравнения, кроме одного — не более 8 переменных, часто матрица разваливается на отдельные кластеры).
Да, есть ситуации (как приведённая в статье 6х6 на 4-м рисунке), что в действительных числах решений много, а в {0, 1} только одно. Но такие ситуации легко диагностируются (неупрощаемая часть СЛАУ с большим количеством переменных), для небольших ситуаций можно использовать перебор. Кстати, в той картинке на 8 мин и 20 закрытых ячеек полный перебор — всего лишь 125970 вариантов.
Так что, NP-полнота на этих объёмах не делает ни жарко, ни холодно. Упомянутых ситуаций, в которых глобальный солвер не может закончить вычисления за разумный промежуток времени тут практически не может быть.

Я писал такое решение Сапёра очень-очень давно (году в 2001).