Машинное обучение для прогнозирования тенниса: часть 1 / forpes.ru

Главная
Машинное обучение для прогнозирования тенниса: часть 1

Машинное обучение для прогнозирования тенниса: часть 1 +16

02.08.2016 14:15

semfromshire 16 11800 Источник

Математическое моделирование тенниса набирает популярность на наших глазах. Каждый год появляются новые аналитические модели и сервисы, соревнующиеся друг с другом в точности прогнозирования исходов теннисных матчей. Это вызвано желанием заработать на стремительно растущем онлайн рынке спортивных ставок: нередки случаи, когда сумма ставок на отдельный матч в профессиональном теннисе достигает миллионов долларов.

В этом обзоре я рассмотрю основные математические методы прогнозирования тенниса: иерархические марковские модели, алгоритмы машинного обучения, а также разберу кейсы IBM, Microsoft и одного российского сервиса, использующих машинное обучение для прогнозирования результатов теннисных матчей.

Содержание
Часть 1
Введение в проблему прогнозирования тенниса
Данные для тенниса
Ставки на спорт

Коэффициенты, предполагаемая вероятность и ROI
Стратегии ставок

Статистические модели

Марковские модели
Иерархические выражения
Оценка вероятности выигрыша при подаче
Современные модели

Часть 2
Машинное обучение в теннисе
Модели машинного обучения

Логистическая регрессия
Нейронные сети
Метод опорных векторов
Другие алгоритмы МО

Проблемы с машинным обучением
Кейсы МО для прогнозирования тенниса

IBM
Microsoft
OhMyBet!

Введение в проблему прогнозирования тенниса

Большой теннис – это отличное зрелище и большие деньги. Ассоциация теннисистов-профессионалов (ATP) ежегодно проводит более 60 профессиональных турниров в 30 странах. За телетрансляцией игры Энди Маррея против Милоша Раонича в финале Уимблдона 2016 следило свыше 13,3 млн. человек в одной только Великобритании. Ставки на теннис догоняют по популярности футбол. На крупнейшей в мире онлайн-бирже ставок Betfair общая сумма ставок на матч Маррей-Джокович в финале Уимблдона 2013 составила 63 млн. долларов. Потенциальная прибыль и научный интерес обусловили всплеск исследований в области алгоритмов точного прогнозирования теннисных матчей.

Система очков в теннисе имеет иерархическую структуру: матч состоит из сетов, которые состоят из геймов, которые состоят из отдельных очков. В большинстве современных подходов к прогнозированию тенниса эта структура используется для получения иерархических выражений вероятности победы игрока в матче на основе марковских цепей. Если считать, что очки в теннисе распределяются независимо и одинаково (independent and identical distribution, IID)[1], для получения выражения необходимо знать только вероятность выигрыша каждым игроком очка при подаче. На основании этой базовой статистики, которую легко получить из исторических данных в Интернете, можно вычислить вероятность выигрыша каждым игроком гейма, потом сета и, наконец, матча.

При всей изящности такого подхода, он не может быть признан идеальным. Представляя качества игроков только по одному параметру (выигранные очки при подаче) такой метод неспособен учитывать более тонкие факторы, которые также влияют на исход матча. Например, приверженность игрока определенной стратегии, время после травмы, общая усталость от предыдущих матчей могут лишь косвенно повлиять на прогноз матча, полученный методом иерархических моделей. Более того, характеристики самого матча – покрытие, местоположение, погода – вообще не учитываются в таком прогнозе.

Принимая во внимание огромное количество исторических данных по теннису, можно предложить альтернативный подход к прогнозированию теннисных матчей – машинное обучение. Параметры игроков и матча вместе с результатом матча могут составить обучающую выборку. Алгоритм машинного обучения с учителем может использовать эту выборку для построения функции предсказания результатов новых матчей.

Несмотря на то, что машинное обучение само собой напрашивается для решения проблемы прогнозирования тенниса, этот подход до недавнего времени привлекал значительно меньше внимания исследователей, чем стохастические иерархические методы. В большинстве исследований применения машинного обучения к теннису используются логистическая регрессия и нейронные сети. ROI наиболее точной модели, описанной в научной литературе, составляет 4,35%, что по заявлению автора на 75% лучше современных стохастических моделей [2].

Большинство онлайн-сервисов прогнозов на теннис (людей-прогнозистов не рассматриваем) используют именно стохастические модели и предлагают пользователям вероятности победы каждого игрока с сопутствующей статистикой, которую предлагается анализировать самостоятельно. Я рассмотрю более интересные случаи, когда с помощью алгоритмов машинного обучения анализируются не только вероятности выигрыша очка при подаче, но и историческая статистика по игрокам и параметры матча. Я рассмотрю кейсы таких гигантов как IBM, Microsoft, а также российского сервиса OhMyBet!, прогнозирующих теннис с помощью алгоритмов машинного обучения.

Но обо всем по порядку.

Данные для тенниса

Исторические данные по теннисным матчам широко доступны в интернете. Официальные сайты турниров, например, www.atpworldtour.com, предоставляют информацию об игроках и результатах матчей, а также результативность спортсмена по каждому матчу. Некоторые источники, например, www.tennis-data.co.uk, предоставляют исторические данные в структурированной форме (CSV или Excel файлы). Доступны и платные базы данных – более комплексные, на более длинные периоды и с лучшей точностью, например, база OnCourt.

Наиболее релевантные данные, которые можно взять из подобных баз данных, представлены в таблице ниже.

Данные об игроке	Имя
	Дата рождения
	Страна
	Призовой фонд
	Рейтинг по очкам
	Общий рейтинг ATP или WTA
Данные о матче	Название турнира
	Тип турнира (например, Большой шлем)
	Покрытие корта
	Местоположение (страна, координаты)
	Дата
	Результат (счет по сетам)
	Призовой фонд
	Коэффициенты (от Pinnacle)
Поматчевая статистика для обоих игроков	Процент выигрыша на первой подаче
	Эйсы
	Двойные ошибки
	Невынужденные ошибки
	Процент очков, выигранных при первой подаче
	Процент очков, выигранных при второй подаче
	Процент очков, выигранных при приеме
	Победители
	Брейк-пойнты (выигранные, всего)
	Выходы к сетке (выигранные, всего)
	Всего выигранных очков
	Самая быстрая подача
	Средняя скорость первой подачи
	Средняя скорость второй подачи
	Коэффициенты (от Pinnacle)

Для моделирования матча могут быть важны и такие данные как статистика по сетам и по очкам для каждого игрока. Эти данные можно получить путем парсинга таких сайтов как flashscore.com. Важно отметить, что с помощью технологии отслеживания мяча HawkEye для многих турниров можно получить данные более высокого качества и детализации, например, положение мяча и игрока в любой момент матча. Однако ассоциация ATP, владеющая этими данными, не выдает лицензии на их использование третьим сторонам.

Ставки на спорт

Существуют две основные категории ставок на теннис: предматчевые и live-ставки, различающиеся уровнем коэффициентов. Кроме того, сделать ставку можно не только на победителя матча, но и на множество других факторов, например, на счет в отдельных сетах, общее количество геймов, и т. д. Большинство прогностических моделей ориентированы на предматчевые ставки на победителя в матче, так как именно на этот тип ставок доступно больше всего исторических данных по коэффициентам, что позволяет провести наиболее полную оценку эффективности прогностической модели.

Ставки на теннисные матчи можно размещать либо в букмекерских конторах (онлайн и оффлайн), либо на биржах ставок. Традиционные букмекеры (например, Pinnacle) устанавливают коэффициенты на различные исходы матча, а клиент (беттор) играет против букмекера. В случае бирж ставок (например, Betfair) клиенты могут делать ставки против коэффициентов, установленных другими бетторами. Биржа уравнивает ставки клиентов и зарабатывает на сборе комиссии с каждой сыгравшей ставки.

Коэффициенты, предполагаемая вероятность и ROI

Коэффициент ставки означает прибыль, которую получит беттор, если верно угадает исход события. Например, если беттор верно спрогнозировал победу игрока, коэффициент на которого составляет 3,00, он получит 2 доллара на каждый поставленный доллар (в добавок к сумме самой ставки, которая возвращается). Если прогноз беттора оказался неверен, он теряет только сумму своей ставки независимо от коэффициентов. Существуют разные системы записи коэффициентов, наиболее популярными из которых являются десятичная или европейская (1,5, 2,00, 2,50 и т. д.) и дробная или британская (1/2, 1/1, 6/4 и т. д.).

Коэффициенты выражают предполагаемую вероятность исхода матча, то есть оценку букмекером истинной вероятности. В описанном выше примере с коэффициентом 3,00 (1 к 3) предполагаемая вероятность p победы игрока в матче равна 33%.

В таблице ниже представлены различные системы записи коэффициентов и соответствующие им предполагаемые вероятности.

Десятичные (Европа)	Дробные (Великобритания)	США	Гонконг	Индонезия	Малайзия	Предполагаемая вероятность
1,50	1/2	-200	0,50	-2,00	0,50	1 к 1,5 = 67%
2,00	1/1 (evs)	+100	1,00	1,00	1,00	1 к 2 = 50%
2,50	6/4	+150	1,50	1,50	-0,67	1 к 2,5 = 40%
3,00	2/1	+200	2,00	2,00	-0,50	1 к 3 = 33%

Формулы пересчета

X	Персчитать в	Действие
Десятичные	Дробные	x-1, затем преобразовать в дробь
Десятичные	США	100*(x-1) если x>2; -100/(x-1) если x<2
Дробные	Десятичные	разделить дробь, затем x+1
Дробные	США	разделить дробь, затем 100*x если x>=1; -100/x если x<1
США	Десятичные	(x/100)+1 если x>0; (-100/x)+1 если x<0
США	Дробные	x/100, если x>0; -100/x, если x<0
Десятичные	Гонконг	x-1
Гонконг	Индонезия	x если x>=1; (1/x)*-1 если x<1
Гонконг	Малайзия	x если x<=1; (1/x)*-1 если x>1

Источник: Википедия

Прибыль за определенный период времени называется возвратом инвестиций (return on investment, ROI). В случае ставок на спорт ROI – это процент выигрыша с каждой сделанной ставки, усреднённый на дистанции. Упрощенная формула ROI при фиксированном размере ставки выглядит так:

где P_n – общая прибыль на дистанции, s — сумма одной ставки, n — количество ставок (дистанция). ROI – это основной показатель успешности беттора, и, соответственно, – целевой показатель эффективности прогностической модели.

Измерение эффективности модели на основании ROI, вычисляемого на исторических данных рынка ставок, является общепринятым подходом в исследованиях в этой области (в том числе в [2], [4], [7]). Если в качестве целевого значения выбирать точность модели (процент верных прогнозов), то при тривиальной фильтрации матчей по низким коэффициентам (1,01-1,3) можно приблизиться к точности 90% и более, но по понятным причинам, ROI при этом будет отрицательной.

Стратегии ставок

Зная коэффициент и предполагаемую вероятность исхода матча, можно принять разные решения, сколько ставить и ставить ли вообще. Очевидно, что различные стратегии дают в итоге разный ROI. Как правило, для оценки эффективности прогностической модели используются три базовые стратегии. Пусть
s_i = размер ставки на игрока i
p_i^bettor — оценка беттором вероятности победы игрока i
b_i = чистый коэффициент при ставке на игрока i, вычисляемый как x-1 для десятичной записи коэффициентов или как x/y для дробной записи.
p_i^implied — предполагаемая вероятность победы игрока i, вычисляемая как (1/x)*100% для десятичной записи x, или как y/(y+x) для дробной записи x/y.

1. Ставка на предсказанного победителя

В простейшей стратегии беттор всегда ставит фиксированную сумму q на прогнозируемого победителя:

2. Ставка на предсказанного победителя с высоким коэффициентом

Беттор может увеличить прибыль, делая фиксированную ставку q только на матчи, где он имеет преимущество над букмекером, то есть оценка вероятности беттором победы игрока i выше, чем вероятность, предполагаемая коэффициентом букмекера. Иными словами, эта стратегия избегает ставок на предсказанного победителя, если коэффициент не компенсирует в достаточной мере риск ставки.

3. Ставка на предсказанного победителя по критерию Келли

В предыдущей стратегии беттор ставит фиксированную сумму, если по его оценке он имеет преимущество по коэффициентам перед букмекером, независимо от величины этого преимущества. Критерий Келлли, описанный Джоном Келли в 1956 г. [3], можно использовать для определения оптимального размера ставки на основании оценочного преимущества беттора и размера его банка. Доказано, что в долгосрочной перспективе критерий Келли оказывается эффективней все других стратегий.

Беттор ставит долю от максимального размера ставки q на предсказанного победителя, если по его оценке он имеет преимущество:

Фактически максимальный размер ставки q – это доля от банка беттора, которая, соответственно, изменяется с течением времени, в зависимости от успеха предыдущих ставок. При оценке прогностических моделей q часто принимается за константу, так чтобы все ставки одинаково влияли на результирующий ROI.

Важно отметить, что во всех трех стратегиях нельзя делать ставки на обоих игроков. Также, если при первой стратегии нужно ставить на каждый матч, рекомендованный моделью (при условии, что оценочная вероятность никогда не бывает ровно 0,5), то вторая и третья стратегии предполагают пропуск некоторых матчей.

Статистические модели

Большинство современных моделей для прогнозирования тенниса используют иерархические стохастические выражения на основе цепей Маркова. Ниже приводится обзор концепций, лежащих в их основе.

Марковские модели

Klaasen and Magnus [1] оспорили теорию IID, показав, что очки в теннисе распределяются не независимо и не одинаково. Однако они также показали, что отклонения от IID настолько малы, что использование этого допущения часто дает хорошие усредненные значения. Этот факт позволяет предположить, что для каждого очка в матче исход этого очка не зависит от предыдущих очков. Предположим далее, что мы знаем вероятность выигрыша очка при подаче каждым игроком. Пусть p – вероятность того, что игрок А выиграет очко при подаче, q — вероятность того, что игрок B выиграет очко при своей подаче. Используя допущение IID и вероятности выигрыша очков, можно построить марковскую цепь, описывающую вероятность победы игрока в гейме.

Формально, цепью Маркова называется система переходов между разными состояниями в пространстве состояний. Важным свойством системы является отсутствие памяти, то есть, следующее состояние системы зависит только от текущего состояния, а не от предшествующей последовательности состояний. Если принять счет в гейме за пространство состояний, а за переходы между состояниями – вероятности того, что игрок А выиграет или проиграет очко, получим цепь Маркова, отражающую стохастическую прогрессию счета в гейме. На рисунке ниже показана схема цепи для одного гейма с подачами игрока А. Обозначив p вероятность выигрыша очка при подаче и принимая допущение IID, получим, что все переходы, означающие очко, выигранное игроком А, имеют ту же вероятность, а все переходы, означающие проигранное очко, имеют вероятность 1–p.

Марковская цепь для гейма в матче, где подает игрок А [2].

За счет иерархической структуры теннисного матча строятся дополнительные марковские цепи, моделирующие прогрессию очков в тай-брейках, сетах и матчах. Например, в модели матча будут два исходящих перехода из каждого неокончательного состояния, помеченные вероятностями выигрыша и проигрыша отдельного сета игроком. Диаграммы таких моделей можно посмотреть в [4].

Иерархические выражения

На основании идеи моделирования теннисных матчей при помощи марковских цепей Barnett and Clarke [5] и O’Malley [6] разработали иерархические выражения вероятности победы определенного игрока во всем матче.

Барнет и Кларк описывают вероятность победы игрока А в гейме при своей подаче P_game с помощью следующего рекурсивного определения:

Граничные значения следующие:

В приведенных выражениях р – это вероятность выигрыша игроком А очка при подаче, x и y – количество очков, выигранных соответственно игроками А и В. Это выражение полностью соответствует марковской цепи на рисунке выше.

Барнет и Кларк также определяют сходное выражение вычисления вероятности выигрыша по сетам на основании вероятностей выигрыша отдельных геймов и тай-брейков (которые тоже зависят от вероятностей выигрыша при подаче). Наконец, вероятность выигрыша в матче можно рассчитать с использованием ранее определенных выражений. Получается, что итоговое выражение для вероятности победы в матче зависит только от вероятности выигрыша очка при подаче каждым из игроков.

Оценка вероятности выигрыша при подаче

Остается вопрос, как оценить эти вероятности выигрыша очка при подаче для еще не сыгранных матчей. Барнет и Кларк приводят метод оценки таких вероятностей из исторической статистики игроков:

где
f_i – процент очков, выигранных при подаче игроком i
g_i – процент очков, выигранных при приеме мяча игроком i
a_i – процент первых подач игрока i
a_av – cредний процент первых подач для всех игроков
b_i – процент выигрыша при первой подаче игрока i
c_i – процент выигрыша при второй подаче игрока i
d_i – процент выигрыша при приеме первой подачи игроком i
e_i – процент выигрыша при приеме второй подачи игроком i

Итак, для матча между игроками А и В мы можем оценить вероятности выигрыша очка при подаче игроками А и В соответственно как f_AB и f_BA, используя следующее уравнение:

где
f_t – средний процент очков, выигранных при подаче на турнире
f_av – средний процент очков, выигранных при подаче для всех игроков
g_av – средний процент очков, выигранных при приеме для всех игроков

Современные модели

Современные модели прогнозирования тенниса основаны на описанных иерархических стохастических выражениях. Knottenbelt [7] уточнил модели Барнета, использовав для вычисления вероятности выигрыша очка при подаче только матчи с общими соперниками игроков, вместо всех прошлых соперников. Этот подход позволяет снизить погрешность, возникающую из-за того, что игроки в прошлом встречались с соперниками разного уровня.

Madurska [4] далее расширила модель общего соперника Кноттенбельта, использовав разные вероятности выигрыша очка при подаче для разных сетов. Таким образом, автор отказалась от допущения IID и ее модель отражает накопление физической усталости у игрока по ходу матча.

Модель общего соперника Кноттенбельта и посетовая модель Мадурски – это наиболее современные статистические модели, авторы утверждают, что ROI по их моделям составил соответственно 6,8% и 19,6% в сравнении с рынком ставок на матчи турниров WTA Большого шлема 2011 года. Модель общего соперника также тестировалась на более крупной и разнообразной выборке из 2173 матчей ATP 2011 г. и показала ROI 3,8%.

Продолжение следует

Библиография

1. F. J. G. M. Klaassen and J. R. Magnus. Are Points in Tennis Independent and Identically Distributed? Evidence From a Dynamic Binary Panel Data Model. Journal of the American Statistical Association, 96:500–509, 2001.
2. M. Sipko. Machine Learning for the Prediction of Professional Tennis Matches. Technical report, Imperial College London, London, 2015.
3. J. Kelly. A new interpretation of information rate. IRE Transactions on Information Theory, 2(3):917–926, 1956.
4. A. M. Madurska. A Set-By-Set Analysis Method for Predicting the Outcome of Professional Singles Tennis Matches. Technical report, Imperial College London, London, 2012.
5. T. Barnett and S. R. Clarke. Combining player statistics to predict outcomes of tennis matches. IMA Journal of Management Mathematics, 16:113–120, 2005.
6. J. A. O’Malley. Probability Formulas and Statistical Analysis in Tennis. Journal of Quantitative Analysis in Sports, 4(2), 2008.
7. W. J. Knottenbelt, D. Spanias, and A. M. Madurska. A common-opponent stochastic model for predicting the outcome of professional tennis matches. Computers and Mathematics with Applications, 64:3820–3827, 2012.

Поделиться с друзьями

-->

Комментарии (16)

khrisanfov
02.08.2016 18:17
#9729706
+2
ROI наиболее точной модели, описанной в научной литературе, составляет 4,35%, что по заявлению автора на 75% лучше современных стохастических моделей [1].

Столько труда, а ROI всего 4%? В таком случае просто положить деньги в банк будет выгодней. Я слышал, что бетторы получаю вплоть до 30% ROI делая ставку чисто интуитивно, опираясь на собственный опыт, почему тогда ROI наиболее точной модели всего 4%?
1. semfromshire
  02.08.2016 18:27
  #9729720
  1. Первое соображение — автор той диссертации умышленно занижает значения, чтобы не светиться. Потому что до 10% ROI вполне можно доходить на дистанции, применяя МО, я об этом напишу во второй части.
  2. Возможно скажу банальщину, но не следует отождествлять ROI и годовой доход по вкладу. ROI — это процент выигрыша с каждой сделанной ставки, усреднённый на дистанции. Так что и при таком ROI профит может быть существенным, а 30% профита с одной ставки — ни о чем не говорит, так как следующая ставка может быть -100%.
  1. wslc
    02.08.2016 20:24
    #9729876
    -1
    Интуитивно кажется, что кроме ROI нужно еще учитывать как часто модель решает ставить, то есть насколько часто бывает, что p_better>p_implied. Иначе может оказаться, что такого почти не бывает.
    Кроме того, под этим углом можно рассмотреть вопрос про 30% у отдельных людей: допустим, человек ставит не на все подряд, а только когда очень уверен, что обыграет букмейкера. Если же сделать, чтобы модель ставила только p_better>2*p_implied, возможно у нее тоже ROI приподнимется, но ставить будет очень редко
  1. r66qq3Ek
    03.08.2016 02:06
    #9730214
    Честно говоря, тема с ROI не раскрыта.
    
    Модель общего соперника также тестировалась на более крупной и разнообразной выборке из 2173 матчей ATP 2011 г. и показала ROI 3,8%.
    
    Из этой фразы трудно сделать иной вывод, кроме того, что начав год со 100USD, я бы его закончил с 103.8USD
    
    jabr
    03.08.2016 09:22
    #9730398
    Да, если за год сделать только 1 ставку.
    
    Mreeew
    03.08.2016 09:22
    #9730400
    +1
    коммент ниже по идее отвечает на этот вопрос)
    чтобы было более понятно
    Предположим мы ставим по 2% денег на каждый матч
    
    budget < — 1000
    ROI < — 0.038
    
    for ( i in 1:2173){
    bet_amount < — budget*0.02 ##взяли 2% денюжек из конверта
    budget < — budget — bet_amount ## в конверте осталось на 2% меньше
    bet_amount < — bet_amount*(1+ROI) ##это мы поставили денюжки на матч и победили
    budget < — budget + bet_amount ##столько денюжек стало в конверте)
    }
    
    print (budget)
    >>5211.422
    
    То есть мы получили в пять раз больше.
    Единственное что тут не учитывается, а это важно — поражения. Цифра 3.8 процента — средняя по больнице, если бы мы постоянно выигрывали с таким ROI, тогда получили бы в 5+ раз больше денег, так как 2% от капитала постоянно растут. Но мы будем иногда проигрывать, тем самым периодически теряя 2% капитала, поэтому итоговая сумма всё таки ниже чем 5211. В любом случае 1038 USD тут не пахнет=)
    У Автора статьи данных побольше, он может сказать реальную цифру в год для конкретной модели.
    Надеюсь помог в осознании)
    
    atikhonov
    03.08.2016 15:15
    #9731270
    можно так: budget((1-0.02)+0.02(1+ROI))^2173=5211.422
    сложные проценты творят чудеса.
    
    r66qq3Ek
    04.08.2016 02:04
    #9732496
    Но мы будем иногда проигрывать...
    
    И добавлю, что проигрываем мы всю ставку целиком, т.е. те самые 2% у нас периодически будут исчезать и их нужно компенсировать другими выигрышами с довольно небольшим средним профитом.
    В общем, если в ваш алгоритм заложить хотя бы 5% вероятности проигрыша (т.е. будем выигрывать «почти всегда»), то уже уйдем в гарантированный минус с такой стратегией.
    
    atikhonov
    04.08.2016 09:27
    #9732668
    Да, действительно, при таких вводных, проигрывать надо реже, чем в 3.66% случаях, если больше, то да, уже итоговый минус
1. TaksShine
  03.08.2016 00:00
  #9730124
  +1
  ROI рассчитывается с оборота, а процент по вкладу — на капитал.
  
  Если наш беттор ставил в 2011 на все матчи ATP по 2% капитала на каждый (консервативный подход), то он обернул капитал более 40 раз, и, соответственно, увеличил выделенный на ставки капитал более чем в 2,5 раза.
  
  Так что 4% — отличный ROI если у вас много ставок.

Gokjer
03.08.2016 17:55
#9731682
Важно отметить, что во всех трех стратегиях нельзя делать ставки на обоих игроков.

Это вообще никогда не должно работать, выгоднее ставить на один исход.
Разве что невероятно странный букмекер позволяет делать беспроигрышные ставки.
1. savostin
  04.08.2016 10:14
  #9732726
  Их можно ставить в разное время…
  1. semfromshire
    04.08.2016 16:36
    #9734148
    Ага, matched betting называется.
1. kenoma
  06.08.2016 13:29
  #9737690
  Есть такая штука — называется арбитражной ситуацией, или surebet по английски. Смысл в том, что у разных контор коэффициенты могут различаться настолько, что поставив ставку ЗА в одной и ПРОТИВ в другой, можно быть в гарантированном плюсе. Только букмекеры жутко ненавидят таких игроков.
  1. el777
    10.08.2016 22:36
    #9745638
    Только букмекеры жутко ненавидят таких игроков.
    
    Это нормально. Букмекеры вообще ненавидят всех, кто выигрывает. Попробуйте, тут же увидите, как они начнут «вставлять палки в колеса». Ограничивать кол-во ставок от вас, установят крошечный максимум на ставку (типа $50), будут требовать всевозможные подтверждения и документы. Один товарищ так выигрывал, ему сделали ограничение по ставкам, он начал ставить от разных виртуалов с мелкими суммами, просить друзей ставить и пр.
    Вобщем, букмекер вас будет любить, только пока проигрываете и несете ему деньги. Как только ситуация изменится, он постарается выдавить вас к конкуренту.

SpanishBoy
03.08.2016 23:46
#9732386
+1
При прочтении так и хотелось некоторые примеры, благо есть ссылки на последнии работы.
Implementation of the paper «Machine Learning for the Prediction of Professional Tennis Matches» (Sipko, 2015).

Конкретно, как оказалось есть даже последователи кто написали рабочий прототип — https://github.com/okh1/tennis-prediction