В Батуми, где я обитаю последние 2 года, очень популярен настольный теннис. Субтропический климат способствует тому, что теннисные столы стоят прямо на бульваре, являясь точкой привлечения как проходящих мимо туристов, так и местных.
Однако у массовости и популярности есть своя отрицательная сторона: в итоге становится сложно найти себе соперника «по руке», чтоб обоим было интересно играть. Мы пробовали разные способы: описывали свои навыки, использовали разные системы оценок, характеризуя свой уровень… Увы, начинающие склонны себя перехваливать, а опытные игроки – недооценивать.
В итоге возникла идея создания рейтингового бота, благо API Telegram предоставляет широкие возможности для этого.
В этой статье я не буду рассказывать про особенности технической реализации. Если появится интерес, потом могу отдельно расписать. Хочу рассказать про то, как пытался вначале «натянуть на глобус» рейтинговую систему RTTF (она же TTW, с минимальными отличиями), а в итоге взял на вооружение систему Эло, которая используется в шахматах.
Постановка задачи
Цель для бота была простая: сделать возможность расчёта рейтинга при регистрации обычных уличных игр, а не только официальных турниров. Т.е. договорился с кем-нибудь поиграть на рейтинг, зарегистрировал результат игры – получил рейтинг.
Первые попытки
Вначале не было сомнений в том, чтоб использовать популярные и проверенные временем формулы. Формула RTTF среди остальных вариантов (TTW, ФНТР) показалась самой продуманной, поэтому именно её начал обкатывать на тестовых сценариях. И буквально сразу столкнулся с определённым сложностями, после которых едва не опустил руки:
Формула RTTF подразумевает турнирный формат. Т.е. серия матчей до 2-3 побед. Ничьей быть не может. В то время как «на улице» играют, как придётся. Могут и сериями, а могут и 15:3 выдать. Или ничью.
Начальный рейтинг новичкам выставляется вручную организатором турнира. Нам же нужна полная автономность.
Формула RTTF хорошо работает только для игроков примерно одного уровня. Если разница в рейтинге победителя и проигравшего составляет более 100 очков (один спортивный разряд), то рейтинг не меняется. В результате, если игроки разных уровней играют вместе, рейтинг может застрять на одном уровне.
В итоге пришлось отказаться от классического варианта и искать что-то другое. А именно -- рейтинг Эло, который давно и относительно успешно используется в шахматах. Относительно – потому что там тоже пришлось использовать определённые костыли для борьбы с накруткой. Тем не менее этот рейтинг больше приспособлен для расчёта рейтинга по парным встречам, нежели рейтинги RTTF-подобной формулы.
Ниже я приведу основные тестовые сценарии для понимания разницы между этими рейтинговыми системами. Если кто готов поверить мне на слово, можете сразу перейти к "Окончательному выводу" в конце статьи.
Ничья
В турнире такая ситуация невозможна, на улице же встречается нередко (когда играют, ограничиваясь доступным временем, или когда при почти равной игре предлагают сыграть «самую последнюю, самую решающую партию»).
Если бы мы использовали рейтинг RTTF, то разумнее всего было бы вернуть 0 прироста рейтинга, потому что эта формула вообще не учитывает подобные варианты. В то время как Эло легко справляется с подобными случаями без всяких дополнительных костылей.
Игрок 1, рейтинг 1400 (соответствует 3-му разряду)
Игрок 2, рейтинг 1800 (соответствует 1-му разряду)
Счёт 1:1
Результат:
Игрок 1, рейтинг 1416 [+16]
Игрок 2, рейтинг 1784 [-16]
Анализ
Обратите внимание на момент, который всегда возмущал (и будет возмущать) игроков, привыкших к RTTF-подобной рейтинговой системе: два игрока сыграли с равным результатом, однако один из них в итоге потерял очки рейтинга. Хуже того, забегая вперёд, скажу, что потерять очки рейтинга можно, даже выиграв. :)
Тем не менее в этом есть логика: если перворазрядник не смог уверенно обыграть третьеразрядника, то действительно ли он на своём месте в рейтинге? Эло корректирует рейтинг обоих игроков в зависимости от результата игры. За счёт этого рейтинг по Эло можно считать гораздо более точным, нежели RTTF-подобный рейтинг, где неважно, как именно ты выиграл, главное, что выиграл.
Вывод
На «улице» ничья – нередкий результат дружеских встреч. В отличие от Эло, RTTF такие результаты считать не умеет.
Одиночные игры, разница в 1 разряд
Проверять будем на игроках с рейтингом 1600 Эло (соответствует 450 RTTF) и 1400 Эло (350 RTTF). Это как раз границы третьего разряда, т.е. играет начинающий второй разряд с начинающим третьим.
Счёт |
Эло |
RTTF |
Комментарий |
1:0 |
1602 (+2) : 1398 (-2) |
450 (0) : 350 (0) |
|
2:0 |
1605 (+5) : 1395 (-5) |
450 (0) : 350 (0) |
|
3:0 |
1607 (+7) : 1393 (-7) |
450 (0) : 350 (0) |
|
4:0 |
1609 (+9) : 1391 (-9) |
450 (0) : 350 (0) |
|
5:0 |
1612 (+12) : 1388 (-12) |
450 (0) : 350 (0) |
|
3:1 |
1600 (0) : 1400 (0) |
450 (0) : 350 (0) |
Эло: ожидаемый результат встречи, нет изменения рейтинга |
3:2 |
1592 (-8) : 1408 (+8) |
450 (0) : 350 (0) |
Эло: слабый игрок взял больше сетов, чем прогнозировалось – прирост рейтинга |
Анализ
В RTTF всё просто: разница между игроками составляет 100 очков, прироста рейтинга нет. К слову сказать, при 99 очках разницы никакого заметного изменения рейтинга тоже не будет.
В Эло, как можно видеть, есть изменение рейтинга в зависимости от счёта. Нужно ещё отметить два любопытных момента:
при счёте 3:1 изменения рейтинга нет, потому что это ожидаемый результат встречи игроков с такой разницей уровня;
при счёте 3:2 более сильный игрок, несмотря на итоговую победу, теряет рейтинг. Потому что либо он играл хуже, чем ожидалось, либо его соперник играл лучше, чем ожидалось от его уровня.
Вывод
При игре с заведомо сильным или слабым соперником RTTF-подобный рейтинг меняться не будет. Для него нужны игроки примерно равного уровня, что реально при организации турниров, но слабо применимо в обычных встречах.
В то же время как Эло не только откорректирует рейтинг по результатам встречи, но ещё и заставит более сильного игрока играть всерьёз, чтоб не потерять рейтинг из‑за самоуверенности в случае слива случайного сета.
Одиночные игры, разница в ½ разряда
Учитывая особенности RTTF формулы, попробуем сравнить игроков в пределах одного разряда. Пусть это будет рейтингом 1500 Эло (соответствует 400 RTTF) и 1400 Эло (350 RTTF), сильный третий разряд с начинающим третьим разрядом.
Счёт |
Эло |
RTTF |
Комментарий |
1:0 |
1504 (+4) : 1396 (-4) |
401,2 (+1,2) : 349,4 (-0,6) |
|
2:0 |
1507 (+7) : 1393 (-7) |
401,5 (+1,5) : 349,25 (-0,75) |
|
3:0 |
1511 (+11) : 1389 (-11) |
401,8 (+1,8) : 349,1 (-0,9) |
Максимальный прирост относительно разряда: 1,8% RTTF, 5,5% Эло |
4:0 |
1514 (+14) : 1386 (-14) |
401,8 (+1,8) : 349,1 (-0,9) |
|
5:0 |
1517 (+17) : 1383 (-17) |
401,8 (+1,8) : 349,1 (-0,9) |
|
3:1 |
1504 (+4) : 1396 (-4) |
401,5 (+1,5) : 349,25 (-0,75) |
|
3:2 |
1498 (-2) : 1402 (+2) |
401,2 (+1,2) : 349,4 (-0,6) |
|
0:1 |
1494 (-6) : 1406 (+6) |
398,2 (-1,8) : 353,6 (+3,6) |
|
0:2 |
1487 (-13) : 1413 (+13) |
397,75 (-2,25) : 354,5 (+4,5) |
|
0:3 |
1481 (-19) : 1419 (+19) |
397,3 (-2,7) : 355,4 (+5,4) |
Максимальный прирост относительно разряда: 5,4% RTTF, 9,5% Эло |
Анализ
Преимущество RTTF формулы над ФНТР или TTW в том, что она учитывает разницу в сетах, что заметно по первым трём играм в таблице. Однако дальше рост не идёт, подразумевается, что вместо 4:0 должны регистрироваться две игры со счётом 2:0, 2:0. Как правильно сделать такое разбиение при регистрации «уличного» счёта – непонятно. К примеру, счёт 4:2 ведь можно разложить как 2:1, 2:1, так и 2:0, 2:0, 0:2.
Ещё можно отметить более активное изменение рейтинга Эло. Впрочем, непонятно, хорошо это или плохо, в любом случае это легко можно откорректировать коэффициентами.
Вывод
Сказать, что какая-то формула тут проявила себя лучше, нельзя. Каждая по-своему хороша.
Читер против обычного игрока
Пришла пора перейти к анализу ситуаций с возможным читерством. От этого никуда не деться и, хотя бот сейчас отказывается работать в чатах, где меньше 20 участников, тем не менее вполне реально возникновение игрока, который на фейковых аккаунтах накрутит себе рейтинг уровня мастера спорта.
Давайте проверим, что такой игрок сможет продемонстрировать при встрече с реальным соперником, который его обыграет со счётом, скажем, 3:0. Пусть у читера будет рейтинг 2000 Эло (750 RTTF), а у обычного игрока рейтинг 1200 (250).
Количество встреч |
Эло |
RTTF |
1 |
1955 (-45) : 1249 (+49) |
737,4 (-12,6) : 275,2 (+25,2) |
2 |
1910 (-90) : 1298 (+98) |
725,2 (-24,8) : 298,6 (+48,6) |
3 |
1865 (-135) : 1346 (+146) |
713,9 (-36,1) : 320,1 (+70,1) |
5 |
1776 (-224) : 1437 (+237) |
692,3 (-57,7) : 359,4 (+109,4) |
10 |
1613 (-387) : 1600 (+400) |
650 (-100) : 437 (+187) |
Аналогично посмотрим на результаты встреч с таким же уровнем: «КМС» против настоящего КМС.
Количество встреч |
Эло |
RTTF |
1 |
1985 (-15) : 2015 (+15) |
747,6 (-2,4) : 754,8 (+4,8) |
2 |
1972 (-28) : 2028 (+28) |
744,8 (-5,2) : 758,5 (+3,5) |
3 |
1960 (-40) : 2040 (+40) |
741,9 (-8,1) : 762,1 (+12,1) |
5 |
1938 (-62) : 2062 (+62) |
737,2 (-12,8) : 768,6 (+18,6) |
10 |
1896 (-104) : 2104 (+104) |
727,8 (-22,2) : 780,4 (+30,4) |
Анализ
В обоих случаях результаты почти идентичны. Да, Эло быстрее скорректировала рейтинг, но это легко меняется соответствующими коэффициентами.
Вывод
Обе формулы хорошо отработали варианты встречи читера и обычного игрока. Сколько бы фейковых побед ты не зарегистрировал, встреча с живыми игроками быстро всё поставит на место, буквально за один турнир.
Окончательный вывод
При одинаковых уровнях (в пределах одного спортивного разряда) обе формулы ведут себя хорошо, показывают схожие результаты. Однако дальше у RTTF начинаются минусы:
1. Строгая привязка к турнирному формату – необходимо место, время, люди.
2. Бесполезность при игре разных уровней (отличающихся на разряд и больше).
3. Затруднительно автоматически выставить начальный рейтинг (посев).
4. Сложности с пересчётом рейтинга по произвольному счёту, включая ничью (3:12, 5:5).
Вердикт: шахматисты победили теннисистов. :)
P. S. Бот для настольного тенниса: @tt_rating_bot, аббревиатура рейтинга TTAR. За короткое время существования (меньше года в разработке) и без какого‑либо внятного продвижения в нём уже зарегистрировано больше 4000 игр.
Бот для тенниса (большого): @TennisRatingBot (TAR), пока им никто не пользуется.
Бот для шахматного рейтинга: @chess_rating_bot. Необходимость сомнительна, делал по просьбе одного гроссмейстера.
Комментарии (39)
root4joy
00.00.0000 00:00+1вспомнил как в универе долг по физре (football) сдал тенисными шариками тренеру/преподователю бокса ... я думаю вам надо рассмотреть монетизацию шариками
Uranic2
00.00.0000 00:00+2Что недопонял автор про рейтинг RTTF:
В RTTF начальный рейтнг огрназатором турнира выставляется только для ПЕРВОГО ПОСЕВА. Система потом сама скорректирует его таким образом чтобы дельта рейтинга в первых 5-ти турнирах была равна нулю. Поэтому важно поучаствовать в играх с разными игроками. Т.е. эта та самая автономность, которая нужна автору.
2.Также автор пишет:
"Если разница в рейтинге победителя и проигравшего составляет более 100 очков (один спортивный разряд), то рейтинг не меняется."
Но забывает добавить, что в только случае победы сильнейшего.Выступления на турнире несколько отличаются от формата сыграть пару игр. В первую очередь мотивацией
В заключение добавлю
У каждого рейтинга есть свои достатки и недостоинтсва.
Рейтинг будет отображать реальное ваше место, только при условии частого участия в рейтинговых турнирах. (Причем нужно играть как с игроками сильнее по рейтингу, так и слабее).
Рейтинг влияет только на две вещи: стартовый посев, и турниры с ограничением по рейтингу
И конечно же посоветую: проведите несколько турниров и у вас у всех определиться рейтинг
KotM Автор
00.00.0000 00:00-11. В RTTF начальный рейтнг огрназатором турнира выставляется только для ПЕРВОГО ПОСЕВА. Система потом сама скорректирует его таким образом чтобы дельта рейтинга в первых 5-ти турнирах была равна нулю. Поэтому важно поучаствовать в играх с разными игроками. Т.е. эта та самая автономность, которая нужна автору.
Начальный посев с помощью специального человека -- это и субъективность, и недостаток автономности. Это уже является препятствием для бота, который должен работать без всякого сопровождения. Более того, там в условиях даже указано про возможность ручного изменения рейтинга задним числом -- прямо костыль на костыле. :)
Но вы и в другом тоже ошибаетесь, насколько я могу судить. Для новичков дельта не равна 0. Там просто коэффициенты другие. В первых пяти играх его рейтинг просто активнее будет меняться, только и всего. От необходимости ручного посева это никак не освобождает.
"Если разница в рейтинге победителя и проигравшего составляет более 100 очков (один спортивный разряд), то рейтинг не меняется."Но забывает добавить, что в только случае победы сильнейшего.
А что это меняет? Это говорит только о том, что в RTTF рейтинг меняется только когда играют примерно равные соперники. Если "на улице" встретятся МС (с выставленным рейтингом) и 3 разряд, который на самом деле играет на уровне 1 разряда, то перворазряднику в случае РТТФ никак не поднять свой рейтинг. Так и будет считаться 3-м разрядом. Для этого в РТТФ есть костыль, описанный в пункте "7. Ручное изменение рейтинга". Что для бота, понятное дело, неприменимо.
Выступления на турнире несколько отличаются от формата сыграть пару игр. В первую очередь мотивацией
Вы не думали, что игра на рейтинг тоже сильно мотивирует? :) А игра по формуле Эло, а не РТТФ, дополнительно ещё мотивирует и более сильного игрока, заставляя его полностью выкладываться. Потому что если в РТТФ он может на расслабоне играть, зная, что по итоговому счёту у него будет победа, то в Эло каждый проигранный сет может привести к минусу.
И конечно же посоветую: проведите несколько турниров и у вас у всех определиться рейтинг
Проводились и проводятся. И я каждый раз сравниваю результаты по Эло и по РТТФ. И явно не в пользу последнего. ;)
Вот ради интереса, посмотрел на список активных игроков, кто у нас регулярно играет в теннис и турниры.
МС
КМС
КМС
2 разряд
2 разряд
2 разряд
2 разряд
3 разряд
С кем тут турниры проводить? Только 2-разрядникам между собой меряться? :) Ну так они друг с другом играют и друг друга держат на своём уровне, не давая выше подняться. КМС им выиграть довольно проблематично.
Кто-то, может, уже и на 1 разряд играет, но как подняться выше? В первого 2-разрядника в списке отрыв от соперника почти в 100 очков, даже за победы дельта мизерная. А до КМС он ещё не достаёт.
Что интересно, у обоих КМС отрыв от МС в 400 очков. И они ни разу ещё его не выигрывали (я сейчас про игры, а не про сеты говорю). А вот по Эло между ними разница как раз в разряд. Потому что 30% партий они выигрывают. :) Вывод? Эло считает гораздо точнее.
Uranic2
00.00.0000 00:00+1Но вы и в другом тоже ошибаетесь, насколько я могу судить. Для новичков дельта не равна 0. Там просто коэффициенты другие. В первых пяти играх его рейтинг просто активнее будет меняться, только и всего.
Нет, я не ошибся. rttf пересчитывает рейтинг задним числом таким образом, чтобы дельта рейтинга новичка стремилась к нулю. А "коэффициент новичка" это действительно другое. Он сделан для того чтобы быстрее рейтинг соответствовал уровню мастерства.
Для этого в РТТФ есть костыль, описанный в пункте "7. Ручное изменение рейтинга".
Почему костыль? Он предназначен как раз для тех случаев, что описаны в п.7. Но подозреваю, что им пользуются настолько редко, что никто про него и не помнит.
Вы слишком зациклились на очках рейтинга, просто нужно играть и выигрывать - тогда и рейтинг будет высокий в любой системе
KotM Автор
00.00.0000 00:00rttf пересчитывает рейтинг задним числом таким образом, чтобы дельта рейтинга новичка стремилась к нулю.
Вы знаете что-то, о чём публично не говорится? Я не могу перепроверить ваши утверждения. Вот смотрю профиль игрока, которого на начальном посеве слегка переоценили: https://rttf.ru/players/103997. Я не вижу тут нулевой дельты.
Вы слишком зациклились на очках рейтинга, просто нужно играть и выигрывать - тогда и рейтинг будет высокий в любой системе
Это напоминает совет: "чтобы стать богатым, нужно рано вставать, поздно ложиться, и весь день продавать нефть".
К тому же как раз ваше утверждение и зациклено на очках рейтинга: чем больше выигрываешь, тем больше рейтинга. А в Эло не так. Там важна не только победа, но и то, как эта победа была добыта. Основная цель Эло -- это всё же не пузомерка, а адекватное определение уровня игрока. То, с чем РТТФ на каком-то этапе перестаёт справляться.
Uranic2
00.00.0000 00:00+2Вот смотрю профиль игрока, которого на начальном посеве слегка переоценили: https://rttf.ru/players/103997. Я не вижу тут нулевой дельты
Ха, так тут всего 15 очков (которые она и так потеряла). На таких маленьких значениях это не работает
Вот пример турнира: https://rttf.ru/tournaments/17608, смотреть на Романову, на скринах в группе у нее рейтинг 100, после пересчета начальный рейтинг стал 300.
Uranic2
00.00.0000 00:00Вы знаете что-то, о чём публично не говорится?
Отсюда https://rttf.ru/content/2
4. Стартовый рейтинг и рейтинг новичков.Игроку, впервые принимающему участие в турнире, стартовый рейтинг для посева выставляет организатор по своему экспертному мнению. Стартовый RTTF-рейтинг назначается на основании результатов сыгранного турнира кратный 25, минимум 100 пунктов и может меняться задним числом на основании результатов следующих турниров.
KotM Автор
00.00.0000 00:00Погодите, а это разве не про ручное изменение говорится? Т.е. организатор переоценил/недооценил новичка, который на турнире показал себя совсем по-другому, и этот же организатор взял и изменил рейтинг задним числом. Разве это не так работает?
Uranic2
00.00.0000 00:00Нет, система rttf автоматически может поправить рейтинг. Организатор может пожаловаться что админам, что алгоритм rttf плохо сработал (такое на моей практике было), и тогда они включают ручной режим. Алгоритм хорошо работает если новичок играет как с игроками выше себя, так и ниже.
mclander
00.00.0000 00:00Сейчас рейтинг ставится 1 новичкам. После турнира пересчитывается исходя из побед/поражений. И так несколько турниров.
mclander
00.00.0000 00:00Я не хочу выкладываться играя с более слабым игроком. Мне это вообще нафиг не нужно. Я хочу выкладываться играя с сильными, а со слабыми экспериментировать и нарабатывать какие-то полусырые ходы.
Иначе мне ( и большинству игроков) со слабым просто неинтересно. Ну найду я у него дыру в игре и буду туда пихать, просто потому, что я это умею, а он нет. И разъяснять ему ничего не буду, оно мне не выгодно.
KotM Автор
00.00.0000 00:00Мне кажется, вы путаете тренировку и игру на рейтинг (турнир). Никто ведь не заставляет регистрировать для рейтинга все игры. Вот до 5 побед поиграли на рейтинг, а дальше тренировка.
А то встречал таких: "Да я на уровне 1 разряда играю! Я тут с КМС поиграл, чуть его не выиграл, 5:2 итоговый счёт!" Начинаешь с ним играть, а он и на третьеразрядника не тянет. Потому что КМС играл не всерьёз, просто развлекался, привыкнув к тому, что имеет значение только итоговая победа.
И если бы считалось по РТТФ, то да, значение имела бы только итоговая победа. А вот по Эло была бы видна разница и вряд ли КМС так легко отдавал бы сеты.
mclander
00.00.0000 00:00В России с 1861года запрещено выигрывать людей. Особенно в контексте предложения из которого не совсем понятно выигрывают что и у кого.
KotM Автор
00.00.0000 00:00Согласен, нужно "обыграть", а не "выиграть".
Я в Грузии, мне простительно. А вам отдельно насыплю пропущенных запятых: ",,". ;)
KotM Автор
00.00.0000 00:00[не понял, как удалять свои комментарии и куда делся комментарий, на который я планировал ответить]
Отвечаю на пропавший комментарий по памяти: в Эло используется коэффициент счёта от 0 до 1, который можно легко вычислить, зная счёт по партиям:
score1 / (score1 + score2)
b237
00.00.0000 00:00Преимущество RTTF формулы над ФНТР или TTW в том, что она учитывает разницу в сетах, что заметно по первым трём играм в таблице. Однако дальше рост не идёт, подразумевается, что вместо 4:0 должны регистрироваться две игры со счётом 2:0, 2:0. Как правильно сделать такое разбиение при регистрации «уличного» счёта – непонятно. К примеру, счёт 4:2 ведь можно разложить как 2:1, 2:1, так и 2:0, 2:0, 0:2.
А если раскладывать как 6 игр с результатом 1:0 или 0:1 не получится то же самое, что и с Эло?
KotM Автор
00.00.0000 00:00Хорошее замечание. Но увы, пришлось отказаться.
Во-первых, на результат в таком случае сильно влияет порядок игр. Как в РТТФ, так и в Эло. Вот результаты двух игр 1:0, потом 0:1 для обеих рейтинговых систем (начальные данные 1500 Эло (400 РТТФ) против 1400 Эло (350 РТТФ)):
Игра 1:0: 1504 (401.2) - 1396 (349.4)
Игра 0:1: 1497 (399.1) - 1403 (352.6)А теперь обратный порядок (те же начальные данные 1500 Эло (400 РТТФ) против 1400 Эло (350 РТТФ)):
Игра 0:1: 1494 (398.2) - 1406 (353.6)
Игра 1:0: 1498 (399.3) - 1402 (352.3)Как видите, порядок игр влияет на конечный результат. Хотя можно было, конечно, попытаться распределить их как можно равномернее... Однако тут вступает в действие второй фактор. Рассмотрим те же игры, но для случая, когда разница между игроками составляет больше 1 разряда (1700 Эло (500 RTTF) и 1400 Эло (350 RTTF)):
Игра 1:0: 1702 (500) - 1398 (350)
Игра 0:1: 1693 (497) - 1407 (356)И в обратном порядке:
Игра 0:1: 1692 (497) - 1408 (356)
Игра 1:0: 1694 (497) - 1406 (497)Казалось бы, всё же одинаково? По итогу и там, и там минус? Вот только обратите внимание на выделенное. РТТФ не даёт бонуса за победу при разнице больше 1 разряда, но отнимает за поражение. :) Т.е. при счёте 11:1 итог будет всё равно не в пользу заведомо сильного победителя.
Конечно, можно было бы какие-то дополнительные условия тут ввести, а что если то, а что если это... Но честно, на тот момент меня уже потряхивало от костыльности этой формулы. И вместо изобретения дополнительных костылей я предпочёл переключиться на изучение другой формулы, которая подобные ситуации отрабатывает "из коробочки".
Jeeno93
00.00.0000 00:00+2Понравилось, что автор не только придумал, как внедрить методику из одного спорта в уличное состязание, но и сделал бота.
Уже начал читать его FAQ)
Попробую применить на работе, где мы тоже частенько рубимся в теннис.
Спасибо!
mclander
00.00.0000 00:00Рттф это рейтинг турнирный. А турнвир состоит из матчей. Класс игрока именно в том, чтобы выиграть решающий сет.
Кроме того при рейтинге учитывающем сеты у сильных игроков пропадет желание "давать поиграть" слабым. А это не значит, что сильный будет бить навылет. Проще включить "боевую" подачу и придушить противника в промежуточной игре.
Я с игроками сильно слабее использую подачу, по которой только нарабатывать игру. И если опп её не принимает, часто уменьшаю вращение или показываю движение, которым принять надёжно.
Так и я получаю тренировку и опп борьбу. А если мне надо терять мало сетов, то оппонент скорее всего будет тупо материться на моих подачах и убеждать себя, что это легко принять.
И тут есть вот такая история, обычно люди хотят играть с теми, кто сильнее их, поэтому, чтобы легко находить равного соперника лучше рейтинг держать на своем уровне или выше. Для чего ещё меньше играть со слабыми )
KotM Автор
00.00.0000 00:00+1Я с этим согласен, но мне есть, чем дополнить.
Не всегда есть возможность участвовать в турнирах. Особенно в таких турнирах, где будут игроки твоего уровня. В небольших городах, особенно где НТ не очень популярен, с этим вообще может быть проблема.
Что до игры, я сейчас пришёл к такому формату игры: к примеру, договариваемся играть час, после разминки играм до 5 побед на рейтинг, а дальше уже со счётом, но без рейтинга. На рейтинг делаешь всё, что умеешь, особо не экспериментируешь, можешь убивать с подачи -- убиваешь. Это рейтинг и он должен показать реальную разницу.
И если в случае РТТФ здесь бы в финале считалась просто победа (которую сильнейший так или иначе всё равно получит), то в Эло тут уже важен каждый сет, на расслабоне не поиграешь даже с заведомо слабым соперником. По себе замечал -- игра на рейтинг в таком случае мобилизует и заставляет выкладываться гораздо сильнее, чем просто на счёт.
А вот потом уже играем остаток времени просто на счёт, без рейтинга. Появляется возможность "точить" приёмы, экспериментировать с новыми подачами и так далее.
И при игре на рейтинг лично у меня появилось гораздо больше интереса играть с соперниками, оказавшимися слабее. А если совсем слабый, то можно и для левой руки рейтинг покачать, бот левую руку тоже поддерживает. :)
dendav
00.00.0000 00:00+1Интересно, что в вводной части был описан эффект Даннинга-Крюгера, который отчасти касается самого автора статьи в контексте обсуждения вопросов рейтинга.
Проблемы тут начинаются еще на уровне концепции. Вроде бы предлагается система для обсчета рейтинга товарищеских, уличных, производственных, школьных и прочих неофициальных мероприятий, но тут же указывается, что даже победитель может потерять рейтинг, так как он, якобы, выиграл недостаточно уверенно. Да он может быть и не хотел побеждать уверенно - он же не на официальном турнире, а в парке. Он мог дать заведомо более слабому игроку просто поиграть, мог сам отрабатывать игру одной стороной, точить подачи или прием, кидать свечи.
В чем может быть мотивация у такого сильного игрока при игре со слабым, если вместо уличного "покидать мячик" он должен как на первенстве фед. округа выносить соперника под ноль? Да ему проще не играть вовсе или не использовать вашу систему. Он же не на работу в зал пришел, а в парк.
Кроме того, у шахматистов ветер очень редко сдувает фигуры с доски, а солнце очень нечасто светит настолько сильно, что игрок начинает путать итальянскую и испанскую партии. А вот в уличных играх в теннис все это случается с завидным постоянством. И фактор случайности тут работает вовсе не в пользу более сильного игрока - вероятность у всех одинаковая, но вот потеря рейтинга - нет.KotM Автор
00.00.0000 00:00Проблемы тут начинаются еще на уровне концепции. Вроде бы предлагается система для обсчета рейтинга товарищеских, уличных, производственных, школьных и прочих неофициальных мероприятий
Действительно, проблема начинается на уровне концепции. Вы ведь даже не поняли, что этот рейтинг никак не может являться "системой для обсчёта мероприятий". :) Мероприятия, турниры и так далее обсчитываются по другим принципам. И победитель турнира далеко не всегда получает больше всех рейтинга, что в РТТФ, что в Эло.
Да он может быть и не хотел побеждать уверенно - он же не на официальном турнире, а в парке. Он мог дать заведомо более слабому игроку просто поиграть, мог сам отрабатывать игру одной стороной, точить подачи или прием, кидать свечи.
Как и собеседник выше, вы путаете игру на рейтинг и тренировку. Если ты играешь на рейтинг, значит играешь серьёзно, на максимуме, показывая все свои возможности. А если нет, то зачем играешь на рейтинг в таком случае? И если будучи МС, слил несколько сетов третьеразряднику, почему удивляешься, что рейтинг просел?
Я так понимаю, это всё проявления некой деформации у тех, кто привык к турнирным форматам, когда в зачёт идёт только победа. Можно 2 сета ковыряться в носу, а потом слегка напрячься и 3 выиграть.
Но даже если рассматривать с этой стороны, то Эло опять же точнее считает: какой игрок лучше, кто всегда готов играть на максимуме, или тот, кто иногда вынужден отдыхать, сливая сеты? ;)
Кроме того, у шахматистов ветер очень редко сдувает фигуры с доски, а солнце очень нечасто светит настолько сильно, что игрок начинает путать итальянскую и испанскую партии. А вот в уличных играх в теннис все это случается с завидным постоянством. И фактор случайности тут работает вовсе не в пользу более сильного игрока - вероятность у всех одинаковая, но вот потеря рейтинга - нет.
О, шахматисты тут очень многое могли бы привести в качестве аргумента. И стул непривычный, и доска, и отвлекающий шум в зале... Но вот только они понимают, что когда что-то мешает одному, то оно же мешает и другому. Более того, сильному это иногда даже на руку, за счёт его опыта.
Рассмотреть ваши же примеры с ветром или солнцем. Они мешают обоим игрокам. Но вот сильный может использовать их в свою пользу: сделать накат при попутном ветре или подсечку при встречном, стараться позиционно играть так, чтоб в момент атаки соперник находился против солнца. Да даже сорванный с траектории мячик опытный игрок подхватит легче, чем неопытный. Странно, что вы этого не понимаете.
mclander
00.00.0000 00:00Солнце жёстко светит в глаза одному в спину второму, как это может использовать более опытный игрок
KotM Автор
00.00.0000 00:00Это вы сейчас серьёзно? Про смену сторон вы не в курсе, что ли?
mclander
00.00.0000 00:00Да серьезно. В том случае, когда более сильный игрок против солнца, у него больше шансов слить сет, чем если они играют в равных условиях.
При учёте сетов, любые помехи получаются в пользу слабого. Так как у него что в равных условиях, что в плохих, вероятность проигрыша не сильно увеличивается. А вот в хороших условиях вероятность выигрыша увеличивается прилично.
При оценки по матчам - это почти не скажется, хотя всё равно такая история в пользу слабого. Достаточно сильному наошибаться на "удобной стороне" или слабому в этот момент соплей навешать. И вот они шансы на матч.
При учёте сетов всё по другому. Это примерно та же история, что игроки в матче дают друг-другу по очереди фору. Чем больше фора тем сильнее увеличиваются шансы слабейшего.
KotM Автор
00.00.0000 00:00Я не хочу больше спорить на эту тему. Подозреваю, вы не очень часто играли в уличных условиях и склонны переоценивать сложности.
Могу только высказать мнение, что ваши суждения справедливы для сильного и слабого в пределах одного разряда. Там солнце может на что-то повлиять. Но когда между игроками разница в 2 и больше разряда, тут слабому уже попросту сложно как-то воспользоваться преимуществом, потому что для более опытного игрока его потуги будут читаться по одному только звуку удара, по силуэту движения.
dendav
00.00.0000 00:00Тяжело отвечать без эмоций, когда собеседник использует аргументацию уровня "вы же даже не поняли". Но иногда нужно примерять на себя то самое когнитивное искажение Даннинга-Крюгера, уютно попивая чаек на самом дне ямы страданий )
Мероприятие - это все что угодно, вплоть до игры двух игроков между собой на свежем воздухе под комментарии зевак. Я хотел использовать более неформальное слово "тусовок", но остановился именно на мероприятиях.
Если ты играешь на рейтинг, значит играешь серьёзно, на максимуме, показывая все свои возможности. А если нет, то зачем играешь на рейтинг в таком случае? И если будучи МС, слил несколько сетов третьеразряднику, почему удивляешься, что рейтинг просел?
Вы идете против концепции, давно принятой в спортивной среде, отсюда у вас будут проблемы с неприятием вашей системы среди игроков. Игроки обязаны выиграть, но не обязаны выигрывать на ноль. Сильный игрок тратит для победы ровно столько сил, сколько требуется. Футбольные команды при счете 4:0 сажают на лавку основных игроков. Даже несмотря на то, что это официальные игры и с огромными по теннисным меркам призовыми.
Какой игрок лучше, кто всегда готов играть на максимуме, или тот, кто иногда вынужден отдыхать, сливая сеты?Разумеется второй. Он может варьировать свои усилия, раскладываться на дистанции нескольких игр, да и вообще, в вашей концепции он побеждает, хотя и отдавая иногда сеты.
KotM Автор
00.00.0000 00:00+1Заметьте, в этой дискуссии не я первый начал подкалывать оппонента с первого же предложения.
Вы идете против концепции, давно принятой в спортивной среде, отсюда у вас будут проблемы с неприятием вашей системы среди игроков.
Поверьте, мне нелегко далось решение использовать непривычную (для НТ) рейтинговую систему. Было много дискуссий с гораздо более опытными игроками, чем я. Иногда это напоминало рассуждения про демократию: "Демократия — плохая форма правления, но остальные еще хуже". Вот только в нашем случае, в отличие от альтернатив демократии, есть явно более продуманная формула рейтинговой системы.
В итоге я понял, что как бы я ни дорабатывал формулу, без строгого следования турнирному формату всё равно будет "не то". Всё равно результаты будут отличаться от привычных, при этом и формула у меня будет изменённая, и все её недостатки тоже будут со мной.
Ну, а раз обвинений в криворукости всё равно не избежать, то почему бы в таком случае не расслабиться и не использовать более продуманную в математическом плане формулу?
Разумеется второй. Он может варьировать свои усилия, раскладываться на дистанции нескольких игр, да и вообще, в вашей концепции он побеждает, хотя и отдавая иногда сеты.
Полагаю, вы заблуждаетесь. То, что первый способен постоянно играть на максимуме, вовсе не означает, что он не умеет варьировать усилия. А вот второй постоянно на максимуме играть не умеет. В итоге их встреча наверняка завершится победой первого, который сможет доминировать от начала до конца, а второй наверняка где-то да дрогнет, либо по привычке, либо из слабости.
Вот ещё пример для затравочки. Есть два мастера, всегда выигрывающих. Друг с другом не играли. Первый всегда выигрывает со счётом 2:0, второй со счётом 2:1. Кто из них сильнее? ;)
mclander
00.00.0000 00:00Вот ещё пример для затравочки. Есть два мастера, всегда выигрывающих. Друг с другом не играли. Первый всегда выигрывает со счётом 2:0, второй со счётом 2:1. Кто из них сильнее? ;)
Неизвестно. Реально неизвестно. Бывают люди рейтингом ниже с которыми ты зарубаешься всегда и больше проигрываешь, чем выигрываешь, а бывают рейтингом выше, которых выносишь и не замечаешь. И на уровне МС также. Любой игрок может назвать нескольких(!) людей, которые рейтингом и мастерством ниже, на которых он бы предпочёл не попадать в официальных и профессиональных соревнованиях. Предпочитая, чтобы их выносили другие. И стиль влияет. Игрок с плотной бескомпромиссной атакой, будет чаще драть соперников на 0, но и чаще проигрывать, чем игрок имеющий сбалансированный арсенал, без суперубойной "пушки". А как они сыграют друг против друга... мой тренер жестких атакеров примерно того же рейтинга с удовольствием дерёт. А недавно проиграл сильному КСМу - шиповику. Которого мощные ребята разматывают с двух ходов.
В НТ очень много решают концовки. Я почти всегда знаю, какая будет для меня концовка равного сета: спокойная и уверенная, зарубная или безнадёжная. Умение собраться в решающие моменты много определяет в НТ. Это в шахматах КМС+ сдаются, зевнув коня в дебюте и даже миттельшпиле. В теннисе же вероятность, что, в шахматных терминах, гроссмейстер зевнёт в ответ ладью, на порядки больше.
KotM Автор
00.00.0000 00:00Я сейчас говорю не про неудобных противников. И не про противников из разных замкнутых сообществ, в одном из которых рейтинг может быть занижен, потому что играют друг с другом и тянут друг друга вниз. Я говорю про гипотетическую ситуацию, когда у наших мастеров одинаковые соперники и предлагаю размышлять с точки зрения средних чисел, а не с точки зрения исключений.
dendav
00.00.0000 00:00Я - детский тренер. Был в рейтингах нескольких стран, выполнял КМС, имею 1 судейскую категорию. Провожу турниры с обсчетом по ТТВ, вел городской рейтинг в старинной досовской программе Баррент, потом на самодельном скрипте. Все это к тому, что "некоторое" представление о рейтингах, их системах, плюсах и минусах я более-менее имею. Даже застал времена, когда помимо самого рейтинга учитывался еще такой показатель как "вес".
Так вот, сама по себе идея автоматизации обсчета рейтинга для локальных групп игроков является вполне здравой. Однако у вас довольно много слабых, неточных, не до конца продуманных вещей почти на всех этапах - от постановки задачи до ее реализации.
Вы постоянно подчеркиваете, что люди путают игру на рейтинг с тренировкой, но тут же указываете, что люди на улице играют как придется, вплоть до ничьих. Однако, если мы говорим о правилах тенниса, то там ничьих быть не может, а в заранее оговоренной игре на рейтинг (а не тренировочном междусобойчике со счетом 5:5) нет никаких проблем организовать привычный 5 или 7-сетовый формат.Далее.
Хочу рассказать про то, как пытался вначале «натянуть на глобус» рейтинговую систему RTTF, она же TTW, с минимальными отличиями.Рейтинговая система РТТФ очень сильно отличается от ТТВ. Разные коэффициенты, учет разницы в сетах, бонусы за призовые места, специфика присвоения опорного-начального рейтинга, другой подсчет первых турниров и всякие другие мелочи.
Формула RTTF хорошо работает только для игроков примерно одного уровня. Если разница в рейтинге победителя и проигравшего составляет более 100 очков (один спортивный разряд), то рейтинг не меняется.
Карамба! Я как-то упустил этот момент во время чтения статьи. Вы плохо понимаете сам принцип работы рейтингов, извините. Если более сильный выигрывает у более слабого (в случае разницы в 100 очков это будет довольно часто, скажем в 90% случаев), то рейтинг действительно победителя не меняется - это результат ожидаемый и закономерный. Однако если выигрывает игрок с меньшим рейтингом, то тут все меняется, игрок с меньшим рейтингом тут же получает большой плюс, а игрок с большим рейтингом теряет много рейтинговых очков. Так происходит везде, в любых рейтингах - ФНТР, ТТВ, РТТФ.
Это говорит только о том, что в RTTF рейтинг меняется только когда играют примерно равные соперники. Если "на улице" встретятся МС (с выставленным рейтингом) и 3 разряд, который на самом деле играет на уровне 1 разряда, то перворазряднику в случае РТТФ никак не поднять свой рейтинг. Так и будет считаться 3-м разрядом.Извините, это какая-то чепуха. Формула расчета такая: [(100 - (PВ - PП)) / 10] * k * D
Допустим, что играют двое с рейтингами 350 и 200. При выигрыше первого рейтинг не меняется, а вот при выигрыше второго мы получаем [(100 - (200 - 350)) / 10] * k * D = 25 * k * D. При k = 0,2 рейтинг изменится в пользу игрока с рейтингом 200 примерно на 5 баллов за одну игру. Почему вы утверждаете, что что перворазряднику в случае РТТФ никак не поднять свой рейтинг?
И еще одно. Я пока не смотрел формулу по которой вы считаете. Она предполагает какую-то инфляцию рейтинга? Что происходит, когда два абсолютно одинаково играющих спортсмена играют 10 встреч и каждый набирает по 5 побед? Я надеюсь, что оба растут в рейтинге, а не имеют дельту равную нулю?
KotM Автор
00.00.0000 00:00Спасибо за внимание к статье и обстоятельный ответ. Попробую сейчас вкратце дать пояснения по каждому вашему замечанию, чтоб вы видели, что все эти моменты я изучал и анализировал, даже если у вас сложилось обратное впечатление.
Вы постоянно подчеркиваете, что люди путают игру на рейтинг с тренировкой, но тут же указываете, что люди на улице играют как придется, вплоть до ничьих. Однако, если мы говорим о правилах тенниса, то там ничьих быть не может, а в заранее оговоренной игре на рейтинг (а не тренировочном междусобойчике со счетом 5:5) нет никаких проблем организовать привычный 5 или 7-сетовый формат.
Форматы игр, которые я встречал на улице:
Турнирный: играем матчи до 2-3 побед.
Матчевый: играем до 5 побед, потом тренируемся.
Временной: играем до конца арендованного времени.
Вот в последнем варианте ничья -- довольно частый случай, когда встречаются одинаковые соперники. Нередко они даже довольны ничьей, потому что друзья. И последний вариант игры среди уличных игроков встречается чаще всего. Первые два в основном используются теми, кто уже "испорчен турнирами". ;)
Рейтинговая система РТТФ очень сильно отличается от ТТВ. Разные коэффициенты, учет разницы в сетах, бонусы за призовые места, специфика присвоения опорного-начального рейтинга, другой подсчет первых турниров и всякие другие мелочи.
Насчёт "сильно отличается" - я бы не был так категоричен. У них одна база и один основной принцип. Отличие только в дополнительном коэффициенте, учитывающем разницу сетов (та-дам, небольшой РТТФ-костыль, который в Эло не нужен, потому что входит в состав самой формулы) и бонусы для победителей турниров. Т.е. принципиальной разницы нет, добавлено немного динамики.
Допустим, что играют двое с рейтингами 350 и 200. При выигрыше первого рейтинг не меняется, а вот при выигрыше второго мы получаем [(100 - (200 - 350)) / 10] * k * D = 25 * k * D. При k = 0,2 рейтинг изменится в пользу игрока с рейтингом 200 примерно на 5 баллов за одну игру. Почему вы утверждаете, что что перворазряднику в случае РТТФ никак не поднять свой рейтинг?
Вот тут вы продемонстрировали один из недостатков формулы РТТФ, который я не упоминал в статье. Если сильный выиграет, он остаётся на месте. Если проиграет, он потеряет рейтинг. В турнирах выбора нет, а вот на улице это может привести к тому, что сильный просто не захочет играть со слабым, потому что победа ему не даст ничего, а поражение приведёт к потере. В итоге те, кто гонятся за рейтингом, попросту не будут рисковать, что приведёт к дискредитации самой идеи любительского рейтинга.
Теперь рассмотрим ваш вариант с перворазрядником и мастером. Согласно Эло, при разнице в 1 разряд вероятность выигрыша составляет 75%. Вот внизу график, разница между разрядами 200 очков.
2 разряда -- это уже 90%.
Так вот, возвращаясь к моему примеру с мастером и 1-разрядником. Согласно графику, из 10 сетов перворазрядник выиграет у мастера только 1. Попробуйте теперь посчитать, сколько нужно провести матчей, чтоб перворазрядник выиграл хотя бы один из них, чтоб продвинуться в рейтинге по РТТФ. А в Эло, как я упоминал, вот этот 1 выигранный сет уже даст перворазряднику прирост.
Хотя нужно быть честным, в Эло тоже добавили определённый костыль, и при разнице больше 400 очков сильный игрок теряет меньше очков, чем полагалось бы строго по формуле -- типа, часть списывается на случайность.
Понимаете, о чём я говорю?
Приведу реальный пример, за которым с интересом наблюдал. Есть мастер спорта с рейтингом 1100 РТТФ. И есть перворазрядник с рейтингом 650 РТТФ. Их обычная статистика игр -- 3:1. Т.е. разница между ними -- 1 разряд, а не 4.
Изначально я импортировал их рейтинг исходя из рейтинга РТТФ. И потом с изумлением наблюдал, как у одного рейтинг постоянно растёт, а у другого постоянно снижается. Пока наконец-то один не поднялся на уровень КМС, а второй так и остался МС, но уже с разумной величиной рейтинга.
По матчам за всё это время упомянутый КМС ни разу у МС не выиграл. Поэтому несмотря на 20 прошедших турниров, он так и остался на уровне 600. А упомянутый МС, несмотря на 50 проведённых турниров, так остался на своём 1100. Т.е. 1-разрядник против МС. В то время как по Эло у нас уже есть КМС, который свою позицию постоянно подтверждает победами над другими игроками.
И это, кстати, не единичный пример, благодаря которому я на практике подтвердил первоначальный вывод, что РТТФ очень плохо считает рейтинг при большой разнице.
И еще одно. Я пока не смотрел формулу по которой вы считаете. Она предполагает какую-то инфляцию рейтинга? Что происходит, когда два абсолютно одинаково играющих спортсмена играют 10 встреч и каждый набирает по 5 побед? Я надеюсь, что оба растут в рейтинге, а не имеют дельту равную нулю?
Если они играют только между собой, то прироста рейтинга нет. Если 2 игрока стабильно играют в пропорции 1:3, то их растащит на расстояние 200 очков относительно начальных рейтингов и там оставит.
В этом есть минус для маленьких сообществ. Если 3 мастера начнут играть только друг с другом с начальным рейтингом, то их рейтинг так и будет в районе начального. В РТТФ же их рейтинг будет непрерывно расти, что является причиной инфляции.
В Эло тоже может быть инфляция за счёт новичков, у которых начальный рейтинг 1000. Какой-нибудь юниор, обыграв десяток новичков, может разом подняться до 3 разряда. При игре с настоящим третьим разрядом он свой рейтинг отдаст третьеразряднику, а третьеразрядник его отдаст выше и так далее, как круги по воде, хорошо хоть с затуханием.
Но тут ещё многое зависит от того, как считать рейтинг, получаемый с новичков. С одной стороны, он нужен, чтоб сильных игроков поставить на правильное место, с другой стороны, может привести к инфляции. Тонкий момент. Но на практике, наблюдая за двумя активными сообществами, где вовсю используется бот, я не могу сказать, что там есть какая-то очевидная инфляция. Нет, вначале идёт процесс насыщения рейтинга, а потом всё, люди достигают своих позиций и рейтинг больше не растёт (если только человек не начинает действительно лучше играть).
KotM Автор
00.00.0000 00:00Ради интереса сейчас посмотрел, сколько за полгода использования бота в нём было зарегистрировано "ничьих": 63 из 4370, 1.4%. Не так уж и мало, чтоб скидывать со счёта.
dendav
00.00.0000 00:00Инфляция рейтинга вещь необходимая. Два игрока, соревнуясь между собой заметное время, всегда растут в уровне за счет наигрыша. Новые игроки без рейтинга (или с маленьким начальным) часто сильно отбирают его у давно играющих - это часто наблюдается в турнирах, куда заявили молодых ребят из ДЮСШ. Опытные игроки с высокими рейтингами заканчивают играть (травмы, возраст, потеря мотивации), унося с собою свои баллы рейтинга, а вместо них появляются молодые-голодные ребята с нулем, отгрызающие рейтинг у более опытных.
Именно поэтому во всех видах рейтинга должна быть определенная инфляция. И она есть в виде большей по модулю дельты у победителя по сравнению с дельтой проигравшего.
Вот тут вы продемонстрировали один из недостатков формулы РТТФ, который я не упоминал в статье. Если сильный выиграет, он остаётся на месте. Если проиграет, он потеряет рейтинг. В турнирах выбора нет, а вот на улице это может привести к тому, что сильный просто не захочет играть со слабым, потому что победа ему не даст ничего, а поражение приведёт к потере. В итоге те, кто гонятся за рейтингом, попросту не будут рисковать, что приведёт к дискредитации самой идеи любительского рейтинга.
Я не совсем понял каким образом мотивация сильного игрока должна резко улучшиться от того, что он даже при выигрыше (по вашей системе) частенько будет оставаться в минусе? Да ему просто будет наплевать на такие игры и он будет сразу предупреждать, что играть на улице будет без всяких рейтингов.Приведу реальный пример, за которым с интересом наблюдал. Есть мастер спорта с рейтингом 1100 РТТФ. И есть перворазрядник с рейтингом 650 РТТФ. Их обычная статистика игр -- 3:1. Т.е. разница между ними -- 1 разряд, а не 4.
Изначально я импортировал их рейтинг исходя из рейтинга РТТФ. И потом с изумлением наблюдал, как у одного рейтинг постоянно растёт, а у другого постоянно снижается. Пока наконец-то один не поднялся на уровень КМС, а второй так и остался МС, но уже с разумной величиной рейтинга.
Что здесь удивительного? Так и должно быть. Перворазрядник будет расти за счет спарринга с сильным мастером спорта, а мастер будет постепенно деградировать из-за игры с игроком, уступающем в классе. Это очень частая история, я лично сам через такое проходил пару раз.
Форматы игр, которые я встречал на улице:
Турнирный: играем матчи до 2-3 побед.
Матчевый: играем до 5 побед, потом тренируемся.
Временной: играем до конца арендованного времени.
Вот в последнем варианте ничья -- довольно частый случай, когда встречаются одинаковые соперники. Нередко они даже довольны ничьей, потому что друзья. И последний вариант игры среди уличных игроков встречается чаще всего. Первые два в основном используются теми, кто уже "испорчен турнирами".
Если вы играете на рейтинг, то вы ничем от "испорченных турнирами" особо не отличаетесь - вы же сами говорите, что не нужно путать тренировочный или развлекательный вариант игры с игрой на рейтинг.
Если вы всерьез относитесь к таким играм, то договаривайтесь заранее о формате без ничьих, в НТ ничьих не бывает.
persii
Интересное сравнение! Спасибо за наглядные объяснения и экскурс в устройство каждой из систем.
Вопрос: понятно, что используются конкретные системы с установленными правилами изменения рейтинга — но почему было проще использовать систему из другой сферы, чем прикостылять недостающее к "родной"?
KotM Автор
К сожалению, эксперименты показали, что это всё равно будет "не то". Потому что "родная" система слишком уж завязана на турнирный формат. Без строгого следования формату результаты пересчёта рейтинга начинают сильно плыть.
В статье приводится пример со счётом 4:2.
По факту это либо 2 победы, либо 2 победы 1 поражение. Рейтинг получится очень разный. Упрёков, что "бот считает не так", всё равно будет не избежать.
В итоге дополнительное "костыляние" привело бы просто к ещё одной формуле, существующей самой по себе. И так ведь есть RTTF, TTW, ФНТР... Все они в базе одинаковые, отличаются только дополнительными коэффициентами, но в итоге приводят к разным конечным результатам.
Вот интересный разбор сравнения очень похожих формул ФНТР и RTTF: https://rttf.ru/content/91. ФНТР обвиняют в инфляции рейтинга. Но что примечательно, у RTTF тоже есть заметная такая инфляция, особенно у топовых игроков. :)
Ну, а раз обвинений в криворукости всё равно не избежать, то почему бы в таком случае не расслабиться и не использовать более продуманную в математическом плане формулу? :)
Опять же, формула Эло используется много где. И теми же шахматистами она тоже дорабатывалась (дополнительные правила при встрече с разницей 400+), поэтому не хотелось терять эту экспертизу. Слежу за изменениями их алгоритма подсчёта (в основном в отношении читеров), внедряю у себя.
persii
Резонно, понятно!
Спасибо большое за классную статью (картинка с женщиной в красном забавная и даже в определённом смысле уместная в своём контексте) и серьёзный ответ ????♀️
KotM Автор
Картинка из фильма "Шары ярости" (не совсем так, но связано). Слегка трешовый, но в общем вполне забавный и может рекомендоваться к просмотру. :)