Всем привет! Меня зовут Григорий Дядиченко, и я технический продюсер. А в прошлом я был профессиональным игроком в покер. Сейчас я решил сделать на Unity пример проекта с покером, который выложу в опенсорс, когда я его доделаю. А пока хочется посмотреть на интересную задачку с определением сильнейшей комбинации в техасском холдеме. Разберём хеш-функции, битовые операции, поиск подмножеств определённой длинны из множества, биномиальный коэффициент и другое. Если вам интересна эта тема, то добро пожаловать под кат!

Немного о покере и о карьере в нём

Пока онлайн покер не был запрещён повсеместно я играл около 8-30 столов на покерном сайте. Играл я в финале по ставкам 0.25/0.5$ и зарабатывал на этом около 1000$ в месяц, что для студента было достаточно неплохо. И сыграл более 3 миллионов рук. Потом в какой-то момент в РФ всё стало запрещено, да и такой заработок хороший, но не предел мечтаний, так что я ушёл в программирование. Но периодически всё равно возвращаюсь к своему старому хобби. И да, конечно же. Не играйте в азартные игры на деньги, вы проиграете. Мне повезло за карьеру заработать больше 40 000$, но это был путь в 4 года, где я прочитал порядка 15 книг по покеру, очень много анализировал свою статистику и занимался этим сутками, прям как работой. Из плюсов покера, что понятия мат. ожидания, дисперсии и ряда задач комбинаторики я понимал на 100%, так как приходилось много такого оценивать.

Чтобы описать алгоритм определения для начала нам надо бы знать правила Техасского Холдема. Все правила я расписывать не буду. Нам лишь важно то, что наш алгоритм должен определять лучшую комбинацию из пяти карт в семи картах. Так как в Техасском Холдеме если вы дошли до того, что открыли карты, то играет пять карт на столе плюс две ваши. Ниже приведу таблицу комбинаций:

Покерной рукой или рукой мы будем называть комбинацию из пяти карт. С условиями задачи плюс-минус разобрались, теперь перейдём к алгоритмам.

Полный перебор

Он конечно же в этой задаче не подходит. Давайте оценим для разминки число способов выбрать 7 карт из колоды в 52 карты. В комбинаторике это число сочетаний. Сочетанием из n по k называется набор элементов k выбранных из n не учитывая порядок. Оно в свою очередь равно биномиальному коэффициенту. То есть формула у нас такая и многим знакомая:

C_{n}^k = \binom{n}{k} = \frac{n!}{k!(n - k)!}

где n — это 52 карты в колоде, k — 7 карт, которые мы из неё выбираем. И мы получаем подставив всё в формулу 133 784 560 комбинаций. Перебирать такое число комбинаций нет никакого смысла. Игроки просто заснут.

Идеальная хеш-функция

На такое решение я наткнулся в этом репозитории пока искал разные варианты реализации. Что такое Perfect Hash Function? Идеальная хеш функция — это хеш-функция, которая отображает отдельные элементы множества в ключи без пересечений. Что в свою очередь позволяет нам искать эти значения по ключу за O(1).

В случае с техасским наше множество это 133 784 560 комбинаций из 7 карт в колоде в 52 карты. В соответствие которым можно поставить разные покерные руки. Каждую комбинацию мы можем представить в виде ключа определив его через 52 битное представление:

Допустим на картинке у нас 5 пик, 7 пик, десять пик (для удобства записи в покере пишется как T), 5 червей, валет бубей, 4 крести и туз крести. То есть комбинация пара пятёрок.

С таким представлением каждому значению 52 битного представления руки будет соответствовать одна комбинация. То есть мы можем пред рассчитать больше 100 миллионов значений наших рук и выбирать из них за O(1). Звучит не очень хорошо по памяти. Только такое число 52-битных ключей будут занимать около 870 мегабайт памяти. А ещё соответствующие им значения рук + вес руки, чтобы рассчитать силу руки. Если у нас серверное решение конечно можно считать прям так, так как 1гб памяти на сервере обычно найти не проблема. Но лучше оптимизировать алгоритм.

Битовая математика

Продолжаем наше исследование. В поисках алгоритма оптимальнее я нашёл вот такую статью. Оно определено для 5-ти карточного покера, но мы же с вами уже знаем комбинаторику. Давайте прикинем. Если нам не важен порядок, то число комбинаций из 5-ти карт, если общее число карт равно 7 будет:.

C_{7}^5 = \binom{7}{5} = \frac{7!}{5!\cdot(7 - 5)!} = \frac{7!}{5!\cdot2!} = \frac{6\cdot7}{1\cdot2} = 21

Перебрать 21 вариант по 5 карт алгоритмом через битовую математику не особо долго. Так как сам алгоритм шустрый. Давайте и его разберём.

Тут так же битовое представление руки, но в немного другой форме.

[9, 9, 9, K, K]
[9, 9, 9, K, K]

У автора зачем-то добавлены лишние биты. Их можно не добавлять и получится новое 52 битное представление руки, только теперь мы ничего не знаем о мастях. Знаем сразу о числе карт и их старшинсве. Основной трюк этого представления заключается в том, что через операции mod (получение остатка от деления) на 15 мы можем легко одной операцией определить 6 видов рук.

  • Каре — остаток 1

  • Фулл хаус — остаток 10

  • Сет — остаток 9

  • Две пары — остаток 7

  • Пара — остаток 6

  • Старшая карта — остаток 5

Это в целом не так сложно доказать, так как у нас информация о числе карт хранится в 4-битах и при остатке от деления на 15 (а в данном случае такое число принимает значения от 0 до 15) мы всегда будем получать такие остатки. Так как 4 одинаковые карты всегда будут давать один блок, который даст остаток 0 (число 15, все 4 бита заполнены) и одну карту, которая не входит в этот диапазон. Можно так же проверить и все остальные комбинации

Но ведь это не все комбинации. Где стриты и флеши? В флеше и стрите очевидно не будет повторов. Так как чтобы карты были по порядку или одной масти, то там не должно быть пар. Поэтому мы запускаем доп. проверки, только если у нас получилась комбинация Старшая карта.

Добавим немного кода. Так как в игре по ряду причин мы вряд ли будем хранить руку в виде строки, как разбирают все примеры. Мы будем иметь структуру вроде.

public struct GameCard
{
    public int Value;
    public CardSuit Suit;
}

где CardSuit

public enum CardSuit
{
    Clubs = 0,
    Diamonds = 1,
    Hearts = 2,
    Spades = 3
}

И проверки на Стрит, Флеш, СтритФлеш и Роял-флеш проще сделать без битовых операций. А просто через код.

Detect Poker Combination
    public static PokerCombination DetectCombination(List<GameCard> cards)
    {
        ulong handValue = 0;
        
        Dictionary<int, int> cardValues = new Dictionary<int, int>();
        foreach (var card in cards)
        {
            if (cardValues.ContainsKey(card.Value))
            {
                cardValues[card.Value]++;
            }
            else
            {
                cardValues[card.Value] = 0;
            }
        }

        foreach (var cardValue in cardValues.Keys)
        {
            var cardsCount = cardValues[cardValue];
            for (int i = 0; i < cardsCount; i++)
            {
                handValue += (ulong) Math.Pow(2, i) << cardValue * 4;
            }   
        }

        var normalizedValue = handValue % 15;
        switch (normalizedValue)
        {
            case 1:
                return PokerCombination.FourOfKind;
            case 10:
                return PokerCombination.FullHouse;
            case 9:
                return PokerCombination.ThreeOfKind;
            case 7:
                return PokerCombination.TwoPair;
            case 6:
                return PokerCombination.Pair;
        }

        bool isSameSuit = cards.TrueForAll(card => card.Suit == cards[0].Suit);
        bool isOrdered = true;
        int? tmpValue = null;
        foreach (var cardValue in cards.OrderBy(card => card.Value))
        {
            if (tmpValue.HasValue)
            {
                if (cardValue.Value - tmpValue.Value != 1)
                {
                    isOrdered = false;
                    break;
                }
                else
                {
                    tmpValue = cardValue.Value;
                }
            }
            else
            {
                tmpValue = cardValue.Value;
            }
        }

        bool isHighAce = Constants.PokerSingleSuitCardsCount - 1 == tmpValue.Value;

        if (isSameSuit)
        {
            if (isOrdered)
            {
                return isHighAce ? PokerCombination.RoyalFlush : PokerCombination.StraightFlush;
            }
            else
            {
                return PokerCombination.Flush;
            }
        }
        else
        {
            if (isOrdered)
            {
                return PokerCombination.Straight;
            }
            else
            {
                return PokerCombination.HighCard;
            }
        }
    }

Чтож. Реализация написана. А теперь давайте проверим работает ли. Для этого напишем простенький тест.

using System.Collections.Generic;
using System.Diagnostics;
using UnityEngine;
using Debug = UnityEngine.Debug;

public class MockTest : MonoBehaviour
{
    [SerializeField] private List<GameCard> _cards;
    [ContextMenu("Test")]
    public void TestMockData()
    {
        Stopwatch stopwatch = Stopwatch.StartNew();
        
        var subsetsForSeat = CollectionsUtils.CombinationsRosettaWoRecursion<GameCard>(_cards.ToArray(), 5);
        foreach (var subset in subsetsForSeat)
        {
            var log = "";
            foreach (var card in subset)
            {
                log += $"Suit:{card.Suit} Value:{card.Value}\n";
            }
            log += $"Result: {HoldemRules.DetectCombination(subset)}";
            Debug.Log(log);
        }
        Debug.Log(stopwatch.Elapsed.ToString());
        stopwatch.Stop();
    }
}

Итак, вот мы и получили наш тест. Задав 7 карт в инспекторе. Мы получили как и ожидается 22 лога (21 на комбинации и 1 на оценку времени).

Работает очень шустро. Так как за столом максимум 7 пользователей, то данная реализация уже подойдёт для продакшен решения. Конечно там есть, что оптимизировать, так как я не указал, что за метод такой CombinationsRosettaWoRecursion:

using System;
using System.Collections.Generic;
using System.Linq;

public class CollectionsUtils
{
    private static IEnumerable<int[]> CombinationsRosettaWoRecursion(int m, int n)
    {
        int[] result = new int[m];
        Stack<int> stack = new Stack<int>(m);
        stack.Push(0);
        while (stack.Count > 0)
        {
            int index = stack.Count - 1;
            int value = stack.Pop();
            while (value < n)
            {
                result[index++] = value++;
                stack.Push(value);
                if (index != m) continue;
                yield return (int[])result.Clone();
                break;
            }
        }
    }

    public static IEnumerable<List<T>> CombinationsRosettaWoRecursion<T>(T[] array, int m)
    {
        if (array.Length < m)
            throw new ArgumentException("Array length can't be less than number of selected elements");
        if (m < 1)
            throw new ArgumentException("Number of selected elements can't be less than 1");
        T[] result = new T[m];
        foreach (int[] j in CombinationsRosettaWoRecursion(m, array.Length))
        {
            for (int i = 0; i < m; i++)
            {
                result[i] = array[j[i]];
            }
            yield return result.ToList();
        }
    }
}

Данный алгоритм был найден в Rosetta Code. На нём есть много прикольных решений задач на разных языках программирования. Я его чуть ухудшил переводом к List, так как не хочется тратить пока время на переделку для иллюстрации концепта. В финальном проекте уже приведу к нормальному виду.

Собственно всё. Остался всего один вопрос. А что если две одинаковые комбинации? Как решать делёжку или ничью? Самый простой способ просто взять, отсортировать карты игроков по старшинству и сравнить попарно. Таким образом получится узнать чья рука сильнее. Определив самую сильную комбинацию. Это уже дело техники так сказать.

В заключении

Спасибо за внимание! Надеюсь статья вам была полезна и интересна. И кому-то пригодится для реализации его проектов. Но помимо самой задачи мы прошлись по таким темам как BitShift, немного комбинаторики и математики. А я пойду дальше дописывать весь проект, чтобы уже потом сделать туториал по полной сборке однопользовательского покера с ботами. Мне кажется боты тоже будут интересной задачкой и кому-то могут пригодится, как иллюстрация, как их можно делать.

Комментарии (6)


  1. static_cast
    14.12.2022 16:02
    +5

    Это же игра, - в неё надо.... играть.

    Не могу не привести MF.


  1. SibirAy
    14.12.2022 16:22
    +3

    я тоже перебрал все возможные комбинации в техаском холдеме) только вы математически доказали в чем я полный ноль))) , а я через код это все сделал, все верно для 7 карт именно столько комбинаций, в моей бд postgresql это заняло 1 Гб + сделал расклад с названием руки все из 7 карт, при этом выделяя 5 карточную лучшую из 7 карт и рангом для сравнения рук у каждого игрока, тут ссылку на видео думаю нельзя оставлять поэтому так! просто тоже нравится техасский холдем и только поэтому начал програмировать и как то затянуло все)


  1. atd
    15.12.2022 10:28

    Эту проблему решают давно и упорно, вот посмотрите один из обзоров готовых решений: https://www.codingthewheel.com/archives/poker-hand-evaluator-roundup/

    P.S.:

    Так как 4 одинаковые карты всегда будут давать один блок, который даст остаток 0 (число 15, все 4 бита заполнены) и одну карту, которая не входит в этот диапазон

    вы решили задачу только для 5-карточного евала, а например для самого популярного техасского холдема нужен 7-карточный евал


    1. 25352
      15.12.2022 11:52

      Задача решалась именно для техасского холдема, в тексте же указано:

      Оно определено для 5-ти карточного покера, но мы же с вами уже знаем комбинаторику. Давайте прикинем. Если нам не важен порядок, то число комбинаций из 5-ти карт, если общее число карт равно 7 будет:

      мы попросту перебираем двадцать одну 5-карточную комбинацию из 7 доступных карт, и исполняем алгоритм для каждой комбинации. Потом оставляем себе лучшую из 21 комбинаций.

      в целом, интересно видеть решение данной задачи «в домашних условиях»


      1. DyadichenkoGA Автор
        15.12.2022 12:07
        +1

        Ага. Задача решена для техасского холдема через перебор вариантов. Я согласен, что это не совсем "честно". Просто учитывая принцип алгоритма и его число операций в той же омахе ну будет в несколько раз больше вариантов. Определение всё равно займёт несущественно времени. Перевести к нужному виду ничего не стоит, и дальше цикл по 5-ти элементам дважды на 5-ти картах. Решение с mod приводит элегантно к такой скорости одного перебора, что нет смысла это особо оптимизировать даже. Это операция которая вызывается не каждый кадр рендера, а по событию смены состояния.

        Я изначально изучая тему думал зайти через матрицы. То есть взять построить матрицу 4 х 13 и поискать какие-то зависимости по определителям, особенно если матрицу приводить к верхнетреугольному виду. Но разобрав этот алгоритм решил, что через матрицы будет не особо то и быстрее. Один проход на 7 картах вместо того чтобы 21 раз перебрать комбинации из 5-ти карт. Но проход этот очень сложный. Так как стритфлеш - 5 карт подряд в строке. Флеш просто 5 карт в строке. Стрит 5 карт подряд в разных столбцах, но не в одной строке. Пары и фуллхаузы определяются примерно так же по столбцам. И у меня была гипотеза что можно двигать каретку с памятью, и дальше получать определение комбинации по "нашёл сильнее". Но я для такого не придумал элегантный обход. Хотя думаю, что в целом он должен быть. Просто паттерны перебирать это явно долго. Так как худшее время это 4 * 13 * 8 = 416 (восемь - это комбинации кроме флеш рояла и старшей руки). Хотя вообще может текущий обход в 21 раз будет чуть помедленнее плюс докинем туда её выбор самих комбинаций из 5-ти карт. Но тут нет драматического выигрыша. А текущей производительности даже для калькулятора в современном мире хватит.

        Если вдруг додумаю и придумаю элегантное решение на матрицах - и про него напишу.


        1. atd
          15.12.2022 20:22

          Если не лень, попробуйте побенчмаркать против других готовых решений ))