Модели точечных процессов внесли значительный вклад в прогнозирование исходов футбольных матчей. Традиционно предполагается, что атакующие и оборонительные способности команд остаются постоянными в течение матча и оцениваются на среднем качестве игры всех других команд за прошлые периоды. В данной статье, опираясь на байесовский подход, предлагается модель динамической силы, которая снимает предположение о постоянстве силы команд и позволяет использовать информацию о текущем матче для их калибровки. Эмпирическое исследование показывает, что, хотя байесовская модель не улучшает прогнозирование разницы голов, она демонстрирует значительные успехи в прогнозировании общего количества голов и исходов матча (победа/ничья/поражение). При ставках на азиатских гандикапах, победы/ничьи/поражения и тоталы, байесовская модель может приносить положительную доходность; это явно контрастирует с моделью точечного процесса с постоянной силой, которая не способна обыграть букмекера.
1. Введение
Футбол — самый популярный вид спорта в мире, и ставки на его исходы имеют давнюю традицию. Кроме того, футбол представляет собой самый быстрорастущий рынок азартных игр. В результате моделирование и прогнозирование исходов футбольных матчей становятся всё более популярными. Прогнозирование исхода отдельного матча — сложная задача, которая делится на два типа: предматчевое прогнозирование и прогнозирование в реальном времени.
Предматчевое прогнозирование ранее использовало модель отрицательного биномиального распределения для футбольных результатов вместо модели Пуассона. Однако после ключевой статьи Махера [Maher1982] анализ данных на основе пуассоновского распределения голов, в котором результаты матчей определяются параметрами атаки и защиты двух команд, получил широкое распространение. Кроме того, поскольку пуассоновская модель применима только в случаях, когда данные однородны во времени и равномерно распределены, МакШейн [McShane2008] предложил модель, основанную на временах между событиями с распределением Вейбулла, которая способна обрабатывать как недостаточно разрозненные данные, так и чрезмерно разрозненные данные. Бошнаков и др. [Boshnakov2017] применили модель Вейбулла для прогнозирования футбольных результатов, и результаты показали, что она работает лучше, чем пуассоновская модель.
Ставки в реальном времени очень популярны, и поэтому прогнозирование в реальном времени заслуживает особого внимания. Однако среди огромного количества литературы по прогнозированию футбольных матчей лишь немногие статьи сосредоточены на прогнозировании в реальном времени. Диксон и др. [Dixon1998] разработали модель, где процессы времени голов домашней и гостевой команд считаются двумя неоднородными пуассоновскими процессами. Чтобы соответствовать практическим условиям, Цзоу и др. [Zou2018] предложили модель марковской цепи с дискретным временем и конечным числом состояний, основанную на пуассоновских процессах, где в течение минуты не происходит более одного гола, за исключением интервалов и
с учётом компенсированного времени, и был выведен рекурсивный алгоритм для точного расчёта вероятности исхода. Вольф [Volf2008] и Титман [Titman2015] изучали влияние других событий, таких как карточки, на матч. Вольф [Volf2008] рассмотрел полупараметрическую модель, включающую непараметрическую базовую интенсивность с регрессионной компонентой, отражающей текущее состояние матча и оборонительную силу команд-соперников. Авторы в [Titman2015] использовали восьмимерный многомерный счётный процесс в реальном времени для изучения взаимодействия между процессами футбольных событий — это не только моделировало взаимозависимость между голами домашней и гостевой команд, но и количественно оценивало влияние карточек на исход игры. Результаты показали, что выдача жёлтых карточек, по-видимому, не оказывает прямого влияния на интенсивность забития голов; напротив, красные карточки оказывают значительный негативный эффект, особенно когда гостевая команда остаётся вдесятером.
Основной недостаток модели Dixon’a заключается в том, что она не учитывает использование информации о текущем матче для обновления силы команд, то есть предполагается, что сила команд остаётся постоянной в течение матча. На самом деле модель, прогнозируя следующий счёт на основе текущего счёта в момент времени , использует только счёт в момент времени
, что повышает точность прогнозирования. Кроме того, оценённые параметры силы команды
основаны на средней производительности против всех других команд в истории. Хотя модель, учитывающая другие события, может использовать информацию о текущем матче для калибровки интенсивности забития, прогнозирование событий часто оказывается довольно сложным.
Чтобы включить как историческую информацию о матчах, так и информацию о текущем матче в модель прогнозирования в реальном времени, мы предлагаем модель калибровки динамической силы команд, основанную на байесовском методе, которая позволяет использовать информацию о текущем матче для калибровки оценок силы каждой команды. Кроме того, мы достигаем предварительной оценки силы команд, используя историческую информацию о матчах.
Остальная часть статьи организована следующим образом. Раздел 2 описывает модель распределения голов во времени, а затем вводит байесовские выводы. Раздел 4 описывает данные, результаты оценок параметров и производительность на выборке out-of-sample. Раздел 5 описывает стратегии ставок и результаты ставок. В заключение, раздел 6 подводит итоги и предлагает направления для дальнейшей работы.
2.Модель распределения голов во времени
Перед тем как описать, как обновлять силу команд с помощью информации о текущем матче, мы сначала кратко изложим модель Диксона и Робинсона (1998) [Dixon1998]. Это базовая модель для калибровки параметров способностей команд, также известная как the pure birth process model (далее: модель процесса рождения). Основное предположение модели заключается в том, что процесс забития голов домашней и гостевой команд рассматривается как двумерный неоднородный пуассоновский процесс. Рассмотрим процесс забития голов для конкретного матча между домашней командой
и гостевой командой
. Существуют два процесса забития голов — для голов домашней и гостевой команд с интенсивностями
и
, которые могут изменяться со временем
и в зависимости от состояния процесса. Функции интенсивности задаются следующим образом:
и
где измеряет силу атаки (чем выше значение
, тем сильнее атака) домашней команды
;
— это сила защиты (чем меньше значение
, тем сильнее защита) гостевой команды
;
— параметр преимущества домашнего поля;
и
— параметры, определяющие интенсивность забития голов при счёте
;
— масштабированное время, прошедшее в течение матча;
и
отражают непрерывное изменение интенсивности со временем (далее время
в функциях интенсивности является масштабированным временем). Для матчей лиги записанная информация о матче составляет 90 минут. Матчи проводятся в два периода по 45 минут. Функция
используется для моделирования эффекта компенсированного времени. Поскольку нет данных о том, сколько компенсированного времени добавлено, времена голов в 45 и 90 минут считаются (возможно) цензурированными наблюдениями. Параметры, представляющие мультипликативную корректировку интенсивности забития в периоды
и
, задаются следующим образом:
Диксон и Робинсон (1998) [Dixon1998] обнаружили, что в наиболее подходящей модели параметр может быть определён следующим образом:
и параметр может быть определён аналогично, где счёт составляет
в момент времени
.
Основой вывода является функция правдоподобия. Для конкретного матча функция правдоподобия, по сути, является функцией двумерного неоднородного пуассоновского процесса, которая может быть выведена путём рассмотрения процесса как последовательности независимых времён между голами. С учётом независимого приращения процесса, если общее количество голов
в матче
больше 0, функция правдоподобия принимает следующую форму:
если голов нет, функция правдоподобия принимает следующую форму:
Наблюдаемые данные — это , где
— масштабированное время
-го гола, а
— индикатор, равный
для гола домашней команды и
для гола гостевой команды. Кроме того, Диксон и Робинсон предположили, что результаты одного матча независимы от результатов другого матча, так что общая функция правдоподобия может быть получена путём произведения по всем матчам.
В модели необходимо оценить параметров для
команд, что представляет собой задачу высокоразмерной нелинейной оптимизации. Для решения этой задачи мы используем алгоритм координатного спуска. Кроме того, параметры модели
непрерывно обновляются в каждом раунде — это связано с тем, что в одном раунде все команды появляются и появляются только один раз, где d — число команд. Более конкретно, мы подгоняем модель на обучающей выборке и прогнозируем исходы матчей следующего раунда. После прогнозирования мы расширяем обучающую выборку, учитывая предсказанные матчи, и перестраиваем модель. Эта процедура повторяется до тех пор, пока не будут спрогнозированы матчи последнего раунда. Для прогнозирования мы применяем рекурсивный алгоритм [Zou2018] для расчёта вероятности исхода. Кодирование модели и последующий байесовский вывод реализованы в Matlab. Байесовский анализ и симуляции методом Монте-Карло (MCMC) выполняются с использованием [Gelman2013, Ross2014].
3.Байесовский вывод
Основная идея этой статьи заключается в использовании предыдущих матчей в качестве априорной информации, а затем её обновлении с помощью информации о текущем матче. Конкретная процедура байесовского вывода показана на рисунке.

За исключением параметров силы команд, другим параметрам модели назначаются априорные распределения — вырожденные распределения. Другими словами, предполагается, что эти параметры известны и постоянны для всех команд в течение одного раунда, а их значения равны оценкам, основанным на модели процесса рождения с историческими матчами. Кроме того, для моделирования характеристик, уникальных для отдельного матча, мы сначала задаём подходящие распределения для параметров силы команд, а затем калибруем их с использованием наблюдаемой информации о текущем матче, предполагая, что средние значения априорных распределений равны оценкам, основанным на модели чистого процесса рождения с историческими матчами.
3.1 Априорные распределения
Для конкретного матча, от начала до времени , если есть
голов, наблюдаемые данные — это
, где значение
совпадает с их значением в уравнении
; если голов нет, наблюдаемые данные — это
. Для простоты обозначим
и
как количество голов домашней и гостевой команд соответственно. Согласно функциям правдоподобия
и
, функция правдоподобия выглядит следующим образом: если общее количество голов больше
от начала до времени
, то
если голов нет от начала до времени , то
где ,
,
,
обозначает параметр интенсивности забития голов домашней команды, который определяется совместно силой атаки и защиты двух команд, участвующих в матче,
. Аналогично,
обозначает параметр интенсивности забития голов гостевой команды,
. Стоит отметить, что в приведённой выше функции правдоподобия
является константным вектором.
Поскольку времена голов обычно записываются в целой части времени гола, т.е. записываются в минутах, интегралы могут быть заменены выражениями в замкнутой форме:
Обратите внимание, что для случая, когда общее количество голов больше 0, если ,
пропорционально функции массы вероятностей пуассоновского распределения; если
или
,
пропорционально сумме нескольких функций массы вероятностей пуассоновских распределений. Широко известно, что гамма-распределение является сопряжённым априорным распределением для пуассоновского распределения. Для удобства расчётов предполагается, что априорное распределение
формируется двумя независимыми гамма-распределениями для домашней и гостевой команд, где корреляция между ними отражается через
и
. Кроме того, копула — это широко используемый метод для изучения ассоциации или зависимости между переменными. Например, простая и почти сопряжённая копула представлена в [Lee1996]. В [Boshnakov2017] использовался счётный процесс, основанный на временах между событиями с распределением Вейбулла, и копула для создания двумерного распределения числа голов, забитых домашней и гостевой командами в матче.
Кроме того, мы предполагаем, что среднее значение априорного распределения равно
, а среднее значение априорного распределения
равно
, где
и
— это оценки максимального правдоподобия
и
, основанные на модели чистого процесса рождения со всеми историческими матчами.
Иными словами, априорные распределения для и
— это соответственно
и
, где
и
— параметры формы, а
и
выступают в качестве параметров масштаба. Кроме того,
,
. Тогда априорное распределение
задаётся следующим образом:
3.2 Апостериорные распределения
Байесовские выводы основаны на наблюдаемых данных, и анализы непосредственно экстраполируются из апостериорного распределения, которое предоставляет априорную и текущую информацию о текущем матче по параметрам.
Когда наблюдается информация о забитых голах от начала матча до времени , апостериорное распределение
задаётся следующим образом:
Если общее количество голов больше 0, апостериорное распределение пропорционально:
если голов нет, то есть , апостериорное распределение пропорционально:
Заметим, что, когда голов нет, апостериорное среднее может быть получено в краткой форме. Однако, когда общее количество голов больше нуля, апостериорное среднее получается в замкнутой, хотя и относительно сложной форме. Кроме того, при дальнейшем байесовском выводе всё ещё необходимо использовать алгоритм Метрополиса для генерации выборок из апостериорного распределения. Однако, если положить ,
пропорционально функции массы вероятностей пуассоновского распределения, и тогда апостериорное распределение будет:
что является гамма-распределением. А именно, апостериорные распределения и
будут:
Оценки параметров и
довольно малы, обычно меньше 0.5. Например, при
,
вносит вклад
в ожидаемое количество голов, где
.
Например, если мы наблюдали информацию о первом тайме, если не учитывать эффект , оставшегося времени игры, мы бы недооценили ожидаемое количество голов лишь на
. Кроме того, эмпирическое исследование показывает, что если оставшееся время игры не учитывается в функции правдоподобия, это мало влияет на конечную точность прогнозирования. Когда общее количество голов больше 0, для функции правдоподобия
мы используем следующее приближение:
Таким образом, независимо от того, есть ли голы в интервале , апостериорные распределения
и
показаны в уравнениях (15) и (16) соответственно.
В этой статье мы используем апостериорные средние как оценки силы команд, калиброванные с информацией о текущем матче. С апостериорными распределениями (14) и (15) апостериорные средние оценки равны:
соответственно. В приведённых оценках,
обозначают ожидаемое количество голов в для домашней и гостевой команд. Мы видим, что расчёт величин
и
требует интегрирования по
и
, которые зависят от случайных значений
и
,
. Для фактического вычисления ожиданий необходимо учитывать вероятности переходов базового парного процесса рождения. Другими словами, нам нужно предсказать вероятности исходов в момент времени
, используя модель процесса рождения и рекурсивный алгоритм [Zou2018].
3.3 Выбор и
Для дальнейшего понимания, возьмём, например, домашнюю команду, мы видим, что
Тогда относительная скорость изменения апостериорной оценки по сравнению с
априорной оценкой равна , а
— это скорость изменения фактического количества голов по
сравнению с ожидаемым количеством голов. Если , скорость изменения будет находиться в интервале
.
Если , скорость изменения оценки будет находиться в
интервале . Чем ниже
, тем больше требуется
калибровка силы с использованием информации о текущем матче. Это позволяет установить, что параметр формы априорного распределения определяет баланс между влиянием информации об исторических матчах («априори») и информацией о голах в текущем матче.
Существует несколько вариантов выбора параметров формы априорных распределений. Один распространённый вариант — задание дисперсии, то есть добавление следующих условий: для домашней команды и
для гостевой команды в матче, где
и
— дисперсии
и
. В сочетании с
и
получаем
и
. Однако, поскольку дисперсии довольно малы, значения
и
почти всегда находятся в интервале (30,150) — это указывает на то, что скорости изменения оценок очень близки к нулю и не приводят к улучшениям.
Другой распространённый вариант — поиск и
для максимизации маргинального распределения наблюдаемых данных — это известно как эмпирический байесовский подход. В эмпирических исследованиях результаты оценок показывают, что
для домашней команды составляет около 3, а
для гостевой команды — около 5. Однако в матче среднее ожидаемое количество голов для домашней и гостевой команд составляет примерно 1.6 и 1.2 соответственно. Предыдущий анализ показывает, что в течение матча скорость изменения оценки будет ниже половины скорости изменения фактического количества голов по сравнению с ожидаемым количеством голов, особенно для гостевых команд. Применяя два предыдущих варианта, можно установить, что модель будет слишком сильно акцентировать внимание на априорной информации, игнорируя наблюдаемые данные.
Теперь мы сосредоточимся на поиске параметров формы априорных распределений с целью балансировки эффектов априорной информации и новой информации о матче. По мере продвижения игры уровень информации о текущем матче увеличивается. Поэтому предпочтительно слегка калибровать силы в первом тайме и усиливать калибровку этих сил во втором тайме.
Предыдущее обсуждение предполагает, что подходящее значение может быть
, что специфично для каждого матча, чтобы учитывать различия в качестве команд и избегать чрезмерного сжатия [Baio2010]. Поскольку ожидаемое количество голов
увеличивается по мере продвижения времени матча, скорость изменения оценки силы будет находиться в интервале
в первом тайме, а во втором тайме — в интервале
. Параметр
для гостевой
команды можно анализировать аналогично, и подходящее значение можно установить как
.
4.Результаты
4.1. Данные
Мы получили данные о времени голов в Английской Премьер-лиге за восемь сезонов с 2009/2010 по 2016/2017 от OPTA https://www.whoscored.com/. Кроме того, мы также собрали данные о живых коэффициентах ставок от OPTA букмекера SBOBet. Данные о ставках содержат информацию о рынке тоталов, рынке форы и рынке исходов (победа дома, ничья, победа гостей). Мы получили данные о коэффициентах для 950 игр с августа 2013 по май 2015 и с января 2017 по май 2017.
4.2. Оценки параметров
В этом разделе мы обсуждаем оценки параметров. Таблица 1 показывает оценки и стандартные ошибки параметров, которые предполагаются вырожденными. Оценки получены на основе модели чистого процесса рождения со всеми матчами, а стандартные ошибки оценены с использованием наблюдаемой информационной матрицы Фишера.
4.2. Оценки параметров
В этом разделе мы обсуждаем оценки параметров. Таблица 1 показывает оценки и стандартные ошибки параметров, которые предполагаются вырожденными. Оценки получены на основе модели чистого процесса рождения со всеми матчами, а стандартные ошибки оценены с использованием наблюдаемой информационной матрицы Фишера.

Чтобы оценить производительность апостериорных распределений стохастических параметров, анализируются доверительные интервалы. Согласно уравнениям (3) и (4), доверительные интервалы для и
равны
соответственно, где ,
.
Затем мы вычисляем долю матчей, чьи априорные оценки параметров силы выходят за пределы доверительного интервала, ко всем матчам. Хотя время матча непрерывно, времена голов обычно записываются в минутах. Таким образом, для каждого матча есть 89 временных точек, с 1-й по 89-ю минуту, которые мы можем использовать для калибровки силы команд, так что существует
доверительных интервалов.
С 1520 матчами с августа 2013 по май 2017 года 44.80% матчей имеют априорные оценки параметров силы, которые выходят за пределы хотя бы одного из доверительных интервалов на уровне значимости 5%; и 90.39% на уровне значимости 10%. Однако приведённый выше расчёт может быть немного завышен, поскольку выход априорных оценок за пределы только одного доверительного интервала может не указывать на изменение силы команд. Тогда для каждого матча мы используем информацию о текущем матче только от начала до времени для калибровки силы команд, так что существует
доверительных интервала. В этом случае 41.97% матчей имеют априорные оценки параметров силы, которые выходят за пределы доверительного интервала на уровне значимости 5%; и 86.84% на уровне значимости 10%. Эти результаты дают обнадёживающие признаки валидности и полезности модели.
4.3. Проверка соответствия модели
Как объяснено в [Gelman2013], после выполнения первых двух шагов байесовского анализа — построения вероятностной модели и вычисления апостериорного распределения всех оцениваемых параметров — мы должны оценить соответствие модели данным и нашим предметным знаниям. Основным инструментом для этой задачи является проверка апостериорного предсказания. Её базовая техника заключается в генерации симулированных значений из совместного апостериорного предсказательного распределения реплицированных данных и сравнении этих выборок с наблюдаемыми данными. Любые систематические различия между симуляциями и данными указывают на потенциальные недостатки модели.
Мы измеряем расхождение между моделью и данными, определяя тестовую статистику. Несоответствие модели по отношению к апостериорному предсказательному распределению может быть измерено вероятностью хвостовой области, или p-значением, тестовой статистики, вычисляемым с использованием апостериорных симуляций . Здесь, чтобы избежать путаницы с наблюдаемыми данными
, мы определяем
как реплицированные данные, которые могли бы быть наблюдаемы. Если у нас уже есть
симуляций из апостериорной плотности
, мы просто генерируем один
из предсказательного распределения для каждой симулированной
; теперь у нас есть
выборок из совместного апостериорного распределения
. Проверка апостериорного предсказания — это сравнение реализованных тестовых величин
и предсказательных тестовых величин
. Для упорядоченных дискретных данных мы можем вычислить «среднее»
-значение:
С точки зрения интерпретации, экстремальное -значение — слишком близкое к 0 или 1 — указывает на несоответствие модели по сравнению с наблюдаемыми данными, и разумный диапазон p-значения находится между
и
.
В частности, мы проводим тест апостериорного предсказания, используя тестовую величину = разница между голами домашней команды и голами гостевой команды. Для каждого матча мы проводим 1000 симуляций из апостериорной плотности
, и у нас есть 1000 выборок из совместного апостериорного распределения
. Таким образом, оценка для байесовского p-значения дана уравнением (23). Рисунок 2 показывает box-plot p-значений для 1520 матчей. Горизонтальная ось показывает, что результаты в интервале времени
наблюдаются. Другими словами, финальный счёт предсказывается условно на счёте в момент времени
. Кроме того, чтобы показать больше информации, мы добавляем 95% и 80% доверительные пределы к box-plot. Указанные доверительные интервалы основаны на выборочных квантилях с
-значениями 1520 матчей. Из этого графика соответствие модели кажется хорошим — реплицированные данные под моделью правдоподобны и близки к имеющимся данным.

4.4. Качество out-of-sample
4.4.1. Rank Probability Score (RPS) (Ранжированный вероятностный счёт)
Чтобы измерить точность предсказания вне выборки, мы сравниваем нашу модель с другими моделями. В частности, мы используем ранжированный вероятностный счёт для исходов победа/ничья/поражение. Brier score (Оценка Брайера) (BS) и ранжированный вероятностный счёт (RPS) — широко используемые меры для описания качества категориальных вероятностных прогнозов. BS можно рассматривать как частный случай RPS с двумя категориями прогноза [Weigel2007].
Brier score измеряет эффективность модели при прогнозировании вероятности каждого класса.
Про применение Brier score можете прочитать в моей предыдущей статье “Прогнозирование результатов футбольных матчей и использование ставки «Обе забьют» (BTTS)”.
RPS особенно подходит для оценки вероятностных прогнозов упорядоченных переменных [Murphy1970]. [Constantinou2012] объяснили, что RPS — наиболее рациональное правило оценки среди тех, что были предложены и использованы для футбольных исходов. Для одного прогноза RPS определяется следующим образом:
где — число потенциальных исходов, а
и
— прогнозы и наблюдаемые исходы на позиции
. Более низкий RPS указывает на более точный прогноз (меньшая ошибка).
Мы сравниваем RPS нашей модели с двумя другими моделями: моделью предматчевого прогнозирования и моделью прогнозирования в реальном времени. Сравнение с моделью предматчевого прогнозирования позволяет действительно увидеть, содержат ли события в текущем матче дополнительную информацию. Модель на основе игроков, предложенная в [Kharrat2016], которая является одной из передовых моделей, выбрана в качестве компаратора предматчевого прогнозирования. Их базовая модель для счёта в футбольном матче — это двумерная модель счёта Вейбулла, описанная в [Boshnakov2017]. Кроме того, динамическая природа силы команд также включена в модель на основе игроков. Для компаратора модели прогнозирования в реальном времени выбрана наша базовая модель, то есть модель чистого процесса рождения.
Чтобы сравнить с результатами RPS, приведёнными в [Kharrat2016], выбрана та же тестовая выборка — данные за полтора сезона (570 матчей) с сезона 2014–2015 по сезон 2015–2016. Лучший результат модели на основе игроков составляет , а таблица 2 представляет значения RPS нашей модели и модели чистого процесса рождения, вероятности предсказания которых зависят от счёта в момент времени
. В начале матча наша модель фактически является моделью чистого процесса рождения, поскольку нет информации о текущем матче для обновления силы команд. Когда наблюдается информация только с начала до 5-й минуты, значения RPS нашей модели и модели чистого процесса рождения выше, чем у модели на основе игроков; значение RPS нашей модели ниже, чем у модели чистого процесса рождения. Когда получена информация о первых 10 минутах после начала, значение байесовской модели ниже, чем у модели на основе игроков, однако значение модели чистого процесса рождения всё ещё выше, чем у модели на основе игроков. С 20-й минуты после начала обе модели прогнозирования в реальном времени работают лучше, чем модель предматчевого прогнозирования. Мы видим, что по мере наблюдения всё большего количества информации значения RPS становятся всё меньше для периода предсказания, который становится короче. Таким образом, результаты второй половины матча не могут объяснить, содержат ли события в текущем матче дополнительную информацию. Однако результаты первых 20 минут могут показать, что использование информации о текущем матче для калибровки силы полезно.

4.4.2. Калибровочная кривая
Калибровку можно интуитивно рассматривать как способ визуализации того, насколько часто модель права или ошибается [Boshnakov2017]. В этом разделе мы напрямую оцениваем калибровку апостериорного предсказательного распределения приближённой байесовской модели, используя 1520 матчей с августа 2013 по май 2017 года. Для каждого предсказательного события мы графически визуализируем производительность модели, строя калибровочную кривую. Затем мы кратко описываем, как оценивать калибровочную кривую в футболе, предложенную в [Boshnakov2017].
Мы делим пространство предсказания на «половины»: мы разделяем данные на верхнюю и нижнюю половины, затем разделяем эти половины, затем рекурсивно разделяем крайние половины. По сравнению с бинами равной ширины, это позволяет интуитивно визуально проверять поведение хвостов. Когда калибровочная кривая лежит ниже диагонали, модель оптимистична в том смысле, что она переоценивает вероятность наступления события; когда калибровочная кривая лежит выше диагонали, модель пессимистична в том смысле, что она недооценивает вероятность наступления события.
Рисунок 3 иллюстрирует калибровочную кривую для прогнозирования победы домашней команды, ничьей и победы гостевой команды. Подграфики сверху вниз описывают кривую для прогнозирования победы домашней команды, победы гостевой команды и ничьей отдельно; подграфики слева направо представляют эмпирическую частоту против вероятности предсказания модели, зависящей от информации о счёте в 10-й, 30-й и 50-й минутах соответственно. Хотя поведение хвостов обеих моделей плохое, в целом кажется, что наша модель лучше калибрована, чем модель чистого процесса рождения. Более того, по мере наблюдения большего количества информации о счёте модель лучше калибруется.

5.Стратегии ставок и результаты
5.1 Стратегия ставок
Чтобы проверить производительность нашей модели на рынках ставок, мы используем простую стратегию ставок, которая делает ставку на событие A, если ожидания от ставок положительны, то есть:
где и
— вероятность предсказания и коэффициент ставки на событие
,
— параметр порога. Увеличение
приводит к более строгому режиму ставок, но, следовательно, к меньшему количеству ставок. Одна единица будет поставлена, когда выполняется указанное выше условие. На рынках тоталов и форы не более одного события будет удовлетворять условию ставки; однако на рынке исходов может быть более одного события, удовлетворяющего условию ставки. Когда более одного события удовлетворяют условию, мы делаем ставку только на событие с наивысшей ожидаемой доходностью. Эта стратегия также применялась в других статьях, авторами которых являются Бошнаков и др. [Boshnakov2017], Диксон и др. [Dixon1997] и Купман [Koopman2015].
5.2 Качество ставок
Чтобы дополнительно проверить качество нашей модели out-of-sample в возможностях предсказания в реальном времени (например, во время матча), мы делали ставки каждые пять минут с целью вычисления средней доходности. Ставки соответственно делались в следующие моменты времени: 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85.
Фактическая доходность ставок в сезонах 2013/8–2015/5 и 2016/8–2017/5 может быть определена с учётом диапазона значений . Вигорош (комиссия букмекера) стандартна на рынках ставок: если букмекеры точны в своих спецификациях вероятностей, у них будет встроенная «доля», соответствующая их ожидаемой прибыли. Чтобы выиграть деньги у букмекеров, в смысле получения положительной ожидаемой доходности, требуется определение вероятностей, которые достаточно точнее, чем те, что получены из коэффициентов, чтобы преодолеть комиссию букмекеров.
На рисунке 4 мы представляем доходность от ставок на рынке тоталов для различных значений . Средняя доходность обеих моделей представлена как полные кривые и сравнивается с отрицательной средней доходностью 3.04%, долей букмекера. Подробная процедура расчёта средней доходности следующая. Сначала для конкретного матча есть 17 временных точек, в которых мы должны решить, делать ли ставку в одну единицу для каждой временной точки в соответствии с уравнением (25). Затем мы можем получить общий чистый доход и общую ставку для матча, далее, общий чистый доход и ставка всех матчей получены. Наконец, общий чистый доход, поделённый на общую ставку всех матчей, — это средняя доходность.

Заметим, что наша модель при общей стратегии не только достигает доходности, превышающей -3.04%, но также генерирует положительную доходность при условии, что порог \tau превышает ноль. Однако доходность модели процесса рождения значительно ниже -3.04%.
По мере увеличения , с сопутствующим установлением более строгого режима ставок, доходность нашей модели также увеличивается, в то время как доходность модели процесса рождения уменьшается. Одна из причин уменьшения доходности по мере увеличения
может заключаться в том, что выбираются всё больше событий с малой вероятностью и очень высокими коэффициентами, в результате чего мы рассчитали среднюю правильность ставок. Результаты показывают, что по мере увеличения
средняя правильность ставок нашей модели лишь уменьшается с примерно 48% до 47%; однако это можно прямо контрастировать со средней правильностью ставок для модели процесса рождения, которая упала с примерно 46% до 36% — это, в свою очередь, подтверждает ожидаемые результаты.
Используя ту же простую стратегию ставок, наша модель получает положительную доходность, в то время как модель процесса рождения не даёт положительной доходности, что предполагает, что доходность в основном исходит из модели.
Рисунок 5 демонстрирует доходность от ставок на рынке форы для различных значений . Средняя доходность обеих моделей представлена как полные кривые и сравнивается с отрицательной средней доходностью 2.47% доли букмекера. Заметим, что обе модели не могут получить положительную доходность. При малых значениях порога наша модель работает лучше, чем модель процесса рождения, однако обе модели работают хуже, чем букмекер. При больших значениях порога наша модель работает хуже, чем модель процесса рождения, и обе модели работают лучше, чем букмекер. Вышеуказанные явления указывают на то, что наша модель не улучшает точность предсказания форы.

Рисунок 6 описывает доходность от ставок на исходы матчей для различных значений . Средняя доходность обеих моделей представлена как полные кривые и сравнивается с отрицательной долей букмекера 5.11%. Очевидно, что наша модель получает доходность, значительно превышающую среднюю отрицательную долю букмекера -5.11%. Кроме того, наша модель начинает получать положительную доходность, когда порог
превышает 0.06 — здесь заметно, что доходность увеличивается по мере увеличения порога. Для модели процесса рождения видно, что она не может достичь положительной доходности. Таким образом, наша модель значительно улучшила предсказание победы, ничьей и поражения.

6.Подводим итоги
В данной статье на основе байесовского метода мы предлагаем модель динамической силы, которая снимает предположение о постоянстве силы команд и позволяет использовать информацию о текущем матче для калибровки их силы. Мы тестировали нашу модель в сравнении с моделью процесса рождения, где силы команд предполагаются постоянными в течение матча, на основе результатов ставок на трёх распространённых рынках. С целью всесторонней проверки производительности модели для матча мы рассчитали среднюю доходность, рассматривая ставки каждые 5 минут. Результаты показывают, что наша модель может обеспечивать положительную доходность и значительно превосходит модель процесса рождения на рынке тоталов. Это также распространяется на рынок исходов 1X2, когда порог превышает 0.06 — в этом случае наша модель успешно достигает положительной доходности и, следовательно, превосходит модель процесса рождения (которая также не может достичь положительной доходности при различных значениях порога). Однако на рынке форы наша модель не демонстрирует явного улучшения в прогнозировании разницы голов. Тем не менее, этот недостаток следует рассматривать в свете того, что наш метод прогнозирования имеет явное и выгодное применение на рынке тоталов и рынке ставок на победу/ничью/поражение.
Хотя мы представили некоторые многообещающие результаты для нашей модели динамической калибровки силы с использованием информации о текущем матче, мы считаем, что возможны дальнейшие улучшения. Во-первых, важно признать, что модель не смогла улучшить точность прогнозирования разницы голов — это указывает на необходимость разработки модели, ориентированной на разницу голов, в будущих исследованиях. Во-вторых, текущая модель использует только информацию о времени голов в матче; расширение за пределы этого ограниченного аспекта с учётом информации о других событиях, таких как красные карточки, может принести значительные исследовательские преимущества. Один из возможных подходов заключается во введении ковариат в базовые параметры силы и
, то есть использовании ковариат для описания силы команды. Кроме того, важные ковариаты могут быть выбраны с использованием байесовского выбора модели. Соответствующую литературу можно найти в [Titman2015, Volf2008]
7.Заключение
Статья получилось достаточно сложной и изобилует большим количеством формул. Посмотрим какое прикладное значение они имеют:
7.1 Применение
Например, можно посчитать ожидаемое количество голов для каждой команды в оствшееся время по формуле:
описывает мгновенную интенсивность (или скорость) забивания голов домашней командой в момент времени
при текущем счёте
(где x — голы хозяев, y — голы гостей). Эта интенсивность для домашней команды в матче
обозначается как
и определяется следующим образом:
Давайте разберем каждый компонент этой формулы:
1. : Параметр домашнего преимущества (home advantage).
* Это постоянный коэффициент, который отражает тот факт, что домашние команды в среднем забивают больше голов. Если a > 1 (a ~ 1.25) , это увеличивает базовую интенсивность голов для хозяев.
2.: Атакующая сила домашней команды H(k).
* Этот параметр характеризует способность домашней команды создавать голевые моменты и забивать голы. Чем выше, тем сильнее атака домашней команды.
3. : Защитная сила гостевой команды A(k).
* Этот параметр характеризует способность гостевой команды обороняться и предотвращать голы. Важно: в модели обычно предполагается, что чем меньше значение , тем сильнее защита. Таким образом, произведение
отражает, насколько легко атаке хозяев преодолеть защиту гостей.
4. : Параметр, зависящий от текущего счёта
.
* Этот коэффициент корректирует интенсивность голов в зависимости от текущей ситуации в матче (кто ведёт, с какой разницей и т.д.). Например, если команда проигрывает, она может увеличить интенсивность атак. В уравнение 4 приводится пример, как может быть определен для разных сценариев счёта:
при счёте
при счёте
если хозяева ведут (например, 2:1, 3:1, 3:2 при условии
)
если гости ведут (например, 1:2, 1:3, 2:3 при условии
)
Или равен 1 в других случаях (например, при ничейном счёте).
* Буква t в в общем уравнении может предполагать и зависимость от времени, но в уравнении (4) показана зависимость только от счёта. Основная идея — счёт влияет на тактику и, следовательно, на интенсивность.
5. : Параметр, моделирующий эффект добавленного (компенсированного) времени.
* Этот коэффициент увеличивает интенсивность голов в последние минуты каждого тайма, когда обычно добавляется время. В уравнение 3 он определяется так:
, если
(конец первого тайма)
, если
(конец второго тайма)
1 в остальное время.
* Здесь t — это нормализованное время матча (от 0 до 1, где 1 соответствует 90-й минуте).
6. : Линейный тренд интенсивности со временем.
Этот член добавляет линейно изменяющийся компонент к интенсивности голов.
— это постоянный параметр. Если
, интенсивность голов домашней команды имеет тенденцию немного возрастать по ходу матча (помимо эффектов
и
). Если
, то убывать.
Итого, (или
в статье) — это динамический показатель, который говорит, с какой скоростью мы ожидаем голы от домашней команды в данный момент
при счёте
. Он учитывает:
Базовые силы команд и преимущество своего поля:
Тактические изменения из-за текущего счёта:
Особенности временных отрезков матча (концовки таймов):
Общий временной тренд в интенсивности:
Расчет параметров ,
, и
является ключевой частью построения точной модели интенсивности голов (и ожидаемого количества голов, соответственно). Эти параметры обычно не вычисляются по прямым формулам из других данных, а оцениваются (эстимируются) на основе исторических данных матчей с использованием статистических методов.
Основная идея заключается в том, чтобы построить полную модель интенсивности голов (ожидаемого количества голов) (например, ту, что описана в уравнении (1) статьи) и затем подобрать значения параметров (а также
) таким образом, чтобы модель наилучшим образом описывала наблюдаемые данные о голах в большом количестве исторических матчей.
Один из популярных методов для этого — Метод Максимального Правдоподобия (Maximum Likelihood Estimation - MLE). Но можно пойти и более простыми методами:
1.Расчет (Эффект компенсированного времени)
Параметр имеет обычно два значения:
для последних минут первого тайма и
для последних минут второго тайма.
Посчитать среднее количество голов, забитых в интервале
минут на один матч (или на одну минуту этого интервала).
Посчитать среднее количество голов, забитых в "обычные" минуты (например, с 1 по 44 минуту) на одну минуту.
.
Аналогично для
с интервалами
и, например,
.
2.Расчет (Эффект текущего счета)
Параметр зависит от текущего счета
В уравнение 4 приведена конкретная параметризация:
Собрать статистику по интенсивности голов (голы в минуту) для каждой из категорий счета (
, и т.д.).
Сравнить эти интенсивности с интенсивностью при базовом счете (например,
или когда
).
.
3.Расчет (Линейный временной тренд)
Параметры (для хозяев) и
(для гостей) представляют собой коэффициенты при линейном члене
в формуле интенсивности:
. Интерпретация: Если
, это означает, что, даже учитывая все остальные эффекты (счет, концовки таймов), существует дополнительная тенденция к увеличению интенсивности голов домашней команды по ходу матча.
Важно понимать, что эти параметры являются частью сложной взаимосвязанной модели. Изолированный расчет одного параметра без учета других может быть неточным. Поэтому предпочтительна оценка всех параметров модели одновременно с помощью MLE или методов машинного обучения на большом наборе данных.
Рассчитав ожидаемое количество голов для каждой команды, можем получить вероятности всех исходов и воспользоваться стратегией, изложенной в разделе 5 для принятия решения и тестирования полученных параметров на прибыль.