Как измерить величину инсайдерской составляющей в текущей линии спортивных ставок и зачем вообще это нужно, если у данного знания какое-то практическое применение?

Предположим, что o=(o_1, o_2, ..., o_n) - это десятичные коэффициенты букмекера для матча с n ≥ 2 возможными исходами, i = 1 . . . n. Обратные

коэффициенты \pi=(\pi_1,\pi_2,...,\pi_n), где \pi_i=\frac{1}{o_i} , могут использоваться

как переменные скрытой силы команды, но не представляют вероятности, поскольку в сумме они больше 1. Как правило, чтобы получить из обратных коэффициентов вероятности мы используем следующий подход:

\beta = \sum _ {i=1}^ {n} \pi_i - сумма обратных "кэфов". Разделив каждый "кэф" на \beta,

p_i=\frac{\pi_i}{\beta} , мы получим набор значений, которые в сумме равны 1 и могут

быть интерпретированы как вероятности исхода. Это называется базовой нормализацией.

В этой статье предложенный альтернативный метод расчёта вероятностей событий (нормализации) по коэффициентам букмекера с учётом наличия инсайдерской составляющей.

Статья в основном теоретическая, следущая будет более прикладная, основанная на развитии идеи Erik'ом Štrumbelj, с оценкой наиболее часто используемых методов прогноза на основе коэффициентов, включая коэффициенты на биржах ставок.

Дополнительно можете узнать "Может ли распределение Пуассона описать статистику футбольных матчей" из моей предыдущей статьи.

0. ВВЕДЕНИЕ

Классический взгляд на рынки - это место, где покупатели и продавцы сходятся по общей цене - цене, в которой предложение равно спросу. Однако на практике большинство финансовых операций осуществляется через посредника, такого как маркет-мейкер, который по сути устанавливает цены для покупателей и продавцов. Цена, с которой сталкиваются покупатели, неизменно отличается от цены, с которой сталкиваются продавцы. Одной из основных причин такого расхождения является то, что маркет-мейкер сталкивается с проблемой неблагоприятного выбора, при которой клиент может торговать на основе более достоверной информации. В этом случае оптимальный спред между покупкой и продажей определяется как компромисс между установлением большого спреда, чтобы минимизировать потери от инсайдов, и установлением оптимального спреда для остальных “аутсайдеров”.

Учитывая, что спред увеличивается по мере распространения инсайдерской торговли, размер наблюдаемого спреда дает некоторое представление о степени искажения рынка из-за наличия инсайда. Это особенно актуально на финансовых рынках, где маркетмейкеры ведут активную ценовую конкуренцию, и вынуждены минимизировать спрэды. Учитывая подходящую модель формирования цен на активы, в рамках которой маркет-мейкеры участвуют в ценовой конкуренции, мы можем оценить размер инсайдерской части на основе спредов, указанных маркет-мейкерами.

Данная статья представляет собой попытку такого измерения с помощью модели ценообразования на рынке стоимости будущих событий (state-contingent claims). Специфической средой для нашего исследования является рынок ставок на скачках, на котором роль маркетмейкеров берут на себя букмекерские конторы, а трейдеров играют потенциальные игроки. Таким образом, наше описание ставок основано на системе, действующей в Великобритании, в которой букмекеры устанавливают коэффициенты, а не на системе распространённой в Северной Америке, в которой коэффициенты определяются методом parimutuel.

Рынок ставок является идеальным инструментом для реализации нашей модели по нескольким причинам. Во-первых, рынок ставок предоставляет однозначный и легкодоступный показатель рыночного спреда. В своей простейшей формулировке рынок ставок на скачки с участием n лошадей соответствует рынку будущих событий с n состояниями, в которых i-е состояние соответствует исходу, при котором i-я лошадь выигрывает скачку. Здесь вы получаете 1 фунт, если событие (state-contingent) произошло (i-я лошадь выиграла), либо получаете 0, если событие не наступило. Цены событий определяются коэффициентами ставок. При этом сумма цен всех событий создает портфель, за который в конце забега точно платят 1 фунт. Отклонение этой суммы цен от единицы представляет собой маржу букмекеров, и эта маржа является однозначным показателем размера рыночного спреда. Это резко контрастирует с более сложными рынками, такими как фондовый рынок, на котором спред варьируется в зависимости от активов, а также от объемов торгов.

В целом, рынок ставок является особенно простым примером финансового рынка. Он собирается около получаса, по истечении которого принимается определенный и общепризнанный результат. Опять же, это отличается от сложных решений, с которыми сталкиваются трейдеры и маркетмейкеры на более сложных финансовых рынках, где соображения отдаленного будущего играют неотъемлемую роль в принятии текущих решений.

Рынок ставок в Соединенном Королевстве хорошо подходит для нашего исследования. Букмекерство на Туманном Альбионе - это крупная и заметная отрасль, в которой ценовую конкуренцию ведут как небольшие независимые букмекерские конторы, работающие на ипподроме, так и крупные сети букмекерских контор по всей стране. Кроме того, существует значительное количество свидетельств, как систематических, так и разрозненных, которые указывают на распространенность инсайдерской торговли на рынке ставок (см., например, Crafts (1985)). Следственный комитет Жокейского клуба признает, что "тренеры и их персонал прибегают к ставкам". Таким образом, можно предположить, что деятельность инсайдерских трейдеров существенным образом влияет на результаты на рынке ставок.

При моделировании рынка ставок мы руководствовались двумя принципами, оба из которых вытекают из требований нашего эмпирического исследования. Во-первых, прогнозируемые цены должны однозначно определяться параметрами задачи, и, более того, прогнозируемые цены должны быть выражены явным и достаточно простым способом в терминах этих параметров.

Второй принцип заключается в том, что прогнозируемые цены должны соответствовать определенным хорошо известным фактам о ценах на рынках ставок. Главным из них является тот факт, что процентные надбавки в ценах по сравнению с истинными вероятностями неодинаковы. В целом, в ценах прослеживается предвзятое отношение к фаворитам забега, при котором нормализованные цены на фаворитов забега занижены, в то время как нормализованные цены на аутсайдеров завышены.

В следующей таблице обобщено исследование Dowie, J. (I976)., посвященное британскому flat racing в 1973 году. Он показывает соотношение выигрышей к ставкам для групп участников, упорядоченных по коэффициентам ставок. В далёком 1973м было проведено около 3000 забегов, в которых приняли участие почти 30 000 участников.

коэффициенты ставок

выигрыш / коэффициент

до 2.0

0.992

до 5.0

0.908

до 10.0

0.894

до 16.0

0.803

Все

0.605

Если бы цены были пропорциональны истинным вероятностям, соотношение выигрыша и ставки было бы постоянным для всех подмножеств. Однако коэффициенты были смещены таким образом, что вероятность выигрыша в пользу фаворитов была ниже (по сравнению с истинными вероятностями), чем вероятность выигрыша в пользу "аутсайдеров". Это вероятностное смещение в пользу малых коэффициентов.

В отличие от системы ставок в Великобритании, в которой букмекеры устанавливают коэффициенты, коэффициенты ставок на североамериканских скачках определяются по методу parimutuel, при котором цены пропорциональны поставленным суммам. Это различие следует иметь в виду при изучении данных по Северной Америке.

В следующем разделе мы представим модель рынка ставок на скачках, состоящих из n лошадей. Решение модели приведено в разделе II. В разделе III мы обеспечим переход от теоретической модели к эмпирической части статьи, построив эмпирическую модель. В разделе IV представлены эмпирические данные.

1. ТЕОРЕТИЧЕСКАЯ МОДЕЛЬ

Наша модель рынка ставок является упрощенной версией модели, представленной Shin (1992). Она описывает рынок ставок на скачки с участием n лошадей. Рынок организован в виде расширенной формы игры, в которой два букмекера соревнуются в установлении коэффициентов, ориентируясь на ожидаемое поведение ставок. В игре участвуют три игрока - уже действующий букмекер, потенциальный букмекер и игрок с инсайдерской информацией («Инсайдер»).. Существует также набор из n человек, называемых "аутсайдерами", обозначаемый множеством \{ 1, 2, ..., n \}. Аутсайдеры формально не моделируются как игроки. Скорее, это механические трейдеры, которые не действуют стратегически. В частности, i-й аутсайдер считает, что i-я лошадь выиграет скачку с вероятностью p_i. Однако, хотя каждый аутсайдер (взятый в отдельности) может быть довольно иррациональным, игра устроена таким образом, что равновесные цены, которые формируются из спроса аутсайдеров к ставкам, являются полностью показательными в том смысле, что равновесные цены совпадают с истинными вероятностями (по сути вероятность формируется из спроса).

Здесь было бы возможно более детальное моделирование аутсайдеров. Можно было бы несколько смягчить допущения, чтобы обеспечить более реалистичное поведение аутсайдеров на индивидуальном уровне. Качественные характеристики модели остались бы неизменными. Целью при формулировке модели является сфокусировать внимание на формировании цен букмекером. Для этой цели мы решили использовать самый простой вариант моделирования аутсайдеров, но при этом учесть две ключевые особенности: во-первых, убеждения аутсайдеров расходятся, и, во-вторых, их совокупное поведение отражает истинные вероятности.

На рынке продается n видов билетов (на n лошадей). За i-й вид билетов выплачивается один фунт, если выигрывает i-я лошадь, и ноль в противном случае. Цена этого билета обозначается \pi_i . Эти цены соответствуют коэффициентам ставок. Коэффициенты от \ k \  до \  l соответствуют цене 1/(k+l) . Отрицательные коэффициенты в нашей модели исключены 0 \le \pi_i \le 1. Может быть продано дробное количество билетов.

Игра представлена в расширенной форме и описывает встречу между одним букмекером и одним игроком. Существует альтернативная интерпретация, в которой букмекер встречается со многими игроками, как описано ниже. Игра состоит из трех этапов.

Этап 1 (этап торгов). Два букмекера - действующий и потенциальный - претендуют на монопольные права на рынке ставок. Каждый из них делает закрытую ставку с положительным действительным числом. Выигрывает тот букмекер, который делает ставку с меньшим числом. Если ставки совпадают, выигрывает действующий. Проигравший, получает нулевую выплату.

Этап 2 (Этап установления цены). Букмекер, выигравший ставку на этапе 1, устанавливает цены \pi_1, \pi_2,...,\pi_n для n типов билетов, при условии, что сумма \sum \pi_i не превышает ставку, поданную на этапе 1, и что

0 \le \pi_i \le 1  \ \forall  i.

Этап 3 (Этап ставок). Затем проводится два независимых эксперимента. Букмекер не может наблюдать за результатом ни в одном из экспериментов. В первом случае победитель гонки выбирается в соответствии с заданными вероятностями p_1, p_2, ...,p_n. i-я лошадь выбирается с вероятностью p_i. Мы предполагаем, что p_i>0  \ \forall i. Во втором эксперименте случайным образом выбирается ровно один игрок, который ставит против букмекера. С вероятностью z в качестве игрока выбирается инсайдер, а с вероятностью (1-z)p_i в качестве игрока выбирается i-й аутсайдер. Если выбран Инсайдер, то он, соответственно, знает победителя и свободен в выборе приобрести билеты у букмекера по объявленным ценам(кэфам) на сумму до 1 фунта стерлингов. С другой стороны, i-й аутсайдер стремится к максимизации ожидаемого выигрыша, полагая, что i-я лошадь выиграет с вероятностью 1. Таким образом, i-й аутсайдер всегда ставит 1 фунт на i-ю лошадь. Как только ставки сделаны, начинается забег, и случайная лошадь, выигрывает. Затем букмекер рассчитывается с игроком в соответствии с коэффициентами, предложенными на этапе 2.

Предположение о том, что два букмекера конкурируют за получение прибыли, претендуя на монопольные права, продиктовано нашим главным интересом, который заключается в определении цен при условии нулевой прибыли. Для нас существенными особенностями являются то, что (i) букмекерская контора предлагает полный набор ставок, и (ii) ожидаемая прибыль равна нулю. Обе эти особенности отражены в нашей модели. Альтернативная стратегия моделирования состояла бы в том, чтобы обеспечить полноценную конкуренцию по Bertrand с четким правилом разделения рынка. При условии, что букмекеры предлагают полный набор ставок, исход ценовой конкуренции совпадает с исходом нашей модели. Хотя наша модель основана на столкновении между одним букмекером и одним игроком, мы могли бы интерпретировать ее как модель, в которой букмекер встречается с большим количеством игроков, где вероятности p_i обозначают пропорцию каждого типа игроков.

2. РАВНОВЕСНЫЕ ЦЕНЫ

Теперь перейдем к решению задачи. Начнем с определения оптимальных цен букмекера, учитывая выигрышную ставку \beta, параметр z и вероятности p_1,...,p_n . Подставляя эти выражения в функцию прибыли букмекера, мы получаем выражение для прибыли букмекера, устанавливающего цену, в пересчете на ставку \beta. Вычисляя равновесную ставку \beta и подставляя в выражения для \pi_1,...,\pi_n мы получаем явные решения для равновесных цен в терминах параметров модели, а именно, частоты инсайдерской торговли, z, и вектора вероятностей выигрыша, p_1,...,p_n. Обозначим через p вектор вероятностей выигрыша (p_1,...,p_n), а через \pi - вектор кэфов (\pi_1,...,\pi_n). Мы можем представить неопределенность, с которой сталкивается букмекер на этапе установления цены, в виде следующей диаграммы.

Рис. 1
Рис. 1

На рисунке 1 показано совместное распределение по площади выборки, полученное в результате пары независимых экспериментов, проведенных на третьем этапе игры. i-я строка матрицы представляет событие, в котором лошадь i выбрана для победы в забеге, в то время как j-й столбец представляет событие, в котором j-й аутсайдер выбран в качестве игрока. (n + i)-й столбец представляет событие, в котором для участия в забеге выбран Инсайдер. Заштрихованные ячейки указывают на те события, в которых букмекер выплачивает выигрыш игроку. Обратите внимание, что букмекер всегда выплачивает выигрыш Инсайдеру.

Любой игрок ставит ровно один фунт на определенную лошадь. Если игрок ставит на i-ю лошадь, цена i - ставки равна 1 / \pi_i. Таким образом, на

втором этапе игры букмекер рассчитывает выплатить z\sum_i (p_i/\pi_i)

Инсайдеру и (1-z)\sum_i (p_i^2/\pi_i) множеству аутсайдеров. Поскольку доход букмекера постоянно составляет один фунт стерлингов, задача букмекера на этапе 2 состоит в том, чтобы;

\left.\begin{aligned} maximize, & \ 1-\sum_i\frac{zp_i+(1-z)p_i^2}{\pi_i} \\  subject \ to, &  \sum_i \pi_i \le \beta, \text { and } 0 \le \pi_i \le 1 \text { for all } i \end{aligned}\right\}

(1)

где \beta выигрышная ставка из Этапа 1.

Допустимое множество задается пересечением множества \{ \pi|\sum_i \pi_i \le \beta \} и единичного куба \{\pi|0 \leqslant \pi, \leqslant 1, \forall i \}. Поскольку оба множества выпуклые, допустимое множество само по себе является выпуклым. Целевая функция строго вогнута в \pi, что можно проверить, используя the Hessian, который представляет собой диагональную матрицу с отрицательными элементами. Таким образом, любое решение задачи максимизации букмекера на этапе 2 является уникальным.

Решение игры зависит от двух случаев, а именно от случая, когда оптимальное значение \pi лежит внутри единичного куба, и от случая, когда оно лежит на границе единичного куба. Поскольку прибыль растет в ценах, сказать, что оптимальное значение \pi лежит на границе единичного куба, значит сказать, что \pi_i=1 для некоторого i. Но поскольку за i-й ставку платят не более одного фунта, это равносильно заявлению о том, что букмекер отказывается принимать ставки на i-ю лошадь. Случай, когда равновесная точка X лежит на границе единичного куба, является теоретической возможностью, к которой следует отнестись серьезно, особенно когда z велика. В статьях 1991, 1992гг, Shin рассматривал крайние решения при различных допущениях. Однако для целей данной статьи мы не будем подробно останавливаться на этих случаях. Это не приводит к потере общности, поскольку на практике ставки принимаются на всех лошадей с конечными коэффициентами. Далее в этой статье мы будем предполагать, что решение задачи оптимизации на третьем этапе находится внутри единичного куба. Однако, поскольку ожидаемая прибыль строго возрастает в

ценах, ограничение \sum_i \pi_i \le \beta , является обязательным, и оптимальное значение \pi удовлетворяет условиям первого порядка. Решение для \pi_i в терминах \beta, z \ и \ p:

 \pi _ {i} = \frac {\beta \sqrt {zp_ {i}+(1-z)p_ {i}^ {2}}}{\sum_s \sqrt {zp_ {s}+(1-z)p_ {s}^ {2}}}  \ \ (2)

Подставляя (2) в (1), мы получаем следующее выражение для ожидаемой прибыли на этапе 1 в виде \beta.

1 - \frac{1}{\beta} \left\{   {\sum_s \sqrt { [zp_s+(1-z)p_s^2]} } \right\}^2 \ \ (3)

Выигрыш обеих букмекерских контор должен быть равен нулю при любом равновесии. Как минимум, он равен нулю, поскольку букмекер получает нулевой выигрыш, предлагая большее количество ставок, чем его соперник. Как максимум, он равен нулю, поскольку соперник может снизить ставку. Таким образом, при любом равновесии выигрышная ставка \beta - это число, при котором (3) равно нулю. То есть,

\beta= \left\{   {\sum_s \sqrt { [zp_s+(1-z)p_s^2]} } \right\}^2 \ \ (4)

Подставляя (4) в (2), мы можем решить для \pi_i в терминах параметров z \ и \  p.

\pi_i =  \sqrt { [zp_i+(1-z)p_i^2] }  \left\{   {\sum_s  \sqrt { [zp_s+(1-z)p_s^2]} } \right\} \ \ (5)

На этом решение задачи завершено. Отметим следующие свойства равновесных цен.

Свойство 1. p \le  \pi в любом равновесии. p = \pi в случае и только в случае если z = 0.

Свойство 2. Если z > 0, равновесные цены демонстрируют предубеждение в пользу высоких коэффициентов. (favourite-longshot bias (недооценка фаворитов)).

\pi_i/\pi_j < p_i/p_j <=>p_i>p_j \ \ (6)

Чтобы убедиться в том, что свойство 1 выполняется, обратите внимание, что

 \sqrt { [zp_i+(1-z)p_i^2] }  >   \sqrt { [zp_i^2+(1-z)p_i^2]}  = p_i

так что \pi_i \geqslant p_i(\sum_sp_s)=p_i. Неравенство строго соблюдается всякий раз,

когда z > 0, и \pi_i=p_i тогда и только тогда, когда z = 0. Другими словами, при отсутствии инсайдерской торговли равновесные цены совпадают с истинными вероятностями, и любое отклонение цен от истинных вероятностей обусловлено положительным распространением инсайдерской торговли. Чтобы проверить свойство 2, из (5) отметим тот факт, что все компоненты p отличны от нуля, что:

\frac {\pi_i}{\pi_j} = \sqrt{ \left[ \frac {zp_i + (1 -z)p_i^2}{zp_j + (1 -z)p_j^2} \right] } =  \frac {p_i}{p_j}  \sqrt{ \left[ \frac {1 - z + (z/p_i)}{1 - z + (z/p_i)} \right] }p_i>p_j\Leftrightarrow z/p_i < z/p_j \Leftrightarrow \pi_i/\pi_j < p_i/p_j

это и есть favourite-longshot bias (недооценка фаворитов) (смещение от фаворитов к аутсайдерам).

В качестве примечания к свойству 1 мы приводим наблюдение о том, что агрегирование информации в нашей игре имитирует определение конкурентных цен в экономике, состоящей из n аутсайдеров, где i-й аутсайдер наделен долей p_i в портфеле. Тогда общий спрос на ставку  i-го

участника равен p_i(\sum_s \pi_s)/\pi_i, так что рыночный клиринг гарантирует, что

\pi_i=p_i \sum_s \pi_s , а цены пропорциональны истинным вероятностям.

Обратите также внимание, что нормализованная цена на i-ю лошадь идентична доле от общего состояния, поставленного на i-ю лошадь. Другими словами, конкурентные цены - это коэффициенты ставок parimutuel.

3. ЭМПИРИЧЕСКАЯ МОДЕЛЬ

Убедившись, что наша модель согласуется со стилизованными фактами, мы переходим к задаче оценки параметра z, который является нашей мерой распространенности инсайдерской торговли. В центре нашего внимания будет выражение для суммы цен (4). Первым шагом в нашем эмпирическом исследовании является выяснение влияния на сумму цен двух параметров нашей модели - z\  и \ p. Для этого рассмотрим функцию

F(p_i) = \sqrt{ \left[ {zp_i + (1 -z)p_i^2} \right] } и ее аппроксимацию второго порядка разложением Тейлора вокруг точки 1/n, которая является,

F(1/n)+F'(1/n)(p_i-1/n)+\frac{1}{2}F''(1/n)(p_i-1/n)^2, суммируем по i​

\sum_{i=1}^{n}  F(p_i)= nF(1/n)+ F'(1/n)\sum_{i=1}^{n}(p_i-1/n)+ \\ \frac{1}{2}F''(1/n)\sum_{i=1}^{n}(p_i-1/n)^2 \ \ \ (7)

Поскольку p - это вектор вероятности, второй член исчезает. Сумма квадратов

\sum_i^n(p_i-1/n)^2 равна квадрату евклидова расстояния между p и центром

единичного симплекса. Это дает представление о "равенстве расстановки" лошадей. Допуская некоторое терминологическое злоупотребление, мы

будем называть (1/n)\sum_i^n(p_i-1/n)^2 "дисперсией" p и обозначать ее

через Var (p). Поскольку nF(1/n)=\sqrt{1+z(n-1)} формулу (7) можно записать в виде:

\sum_{i=1}^{n}  F(p_i)= \sqrt{1+z(n-1)}+ \frac{1}{2}nF''(1/n)Var(p) \ \ (8)

Из решения равновесной ставки \beta, приведенного в (4), следует, что сумма

цен \sum_i \pi_i равна квадрату \sum_i F(p_i). Таким образом, возводя в квадрат

обе части (8) и вычитая единицу из обеих сторон, мы получаем выражение для отклонения суммы цен от единицы. Обозначим это отклонение через D и отметим, что:

D=z(n-1)+ n\sqrt{1+z(n-1)} F''(1/n)Var(p)+ \\ \frac{1}{4}n^2 \left[  F''(1/n)Var(p) \right]^2 \ \ \ \ \ (9)

Пусть A=n\sqrt{1+z(n-1)}F''(1/n) \ \ и \ \ B=\frac{1}{4}n^2 \left[ F''(1/n) \right]^2 .

Поскольку z - постоянная величина, A и B являются нелинейными алгебраическими функциями от n, которые непрерывны в n при n > 0. Таким образом, применяя теорему Вейерштрасса об аппроксимации (Weierstrass Approximation Theorem), A и B могут быть аппроксимированы с любой произвольной степенью точности полиномами в n. Таким образом, пусть

A=\sum_{k=0}^K a_kn^k \ \ \ B=\sum_{k=0}^K b_kn^k

для некоторого целого числа K и констант \left\{ a_k \right\} \text {and} \left\{ b_k \right\}, где k=0,1,...,K

Подставляя их в (9), мы получаем следующее уравнение, которое выражается в виде линейной комбинации переменных (n-1), \left\{n^kVar(p)\right\}, and \left\{ n^k [Var(p)]^2 \right\}, где k=0,1,...,K

D=z(n-1)+ \sum_{k=0}^K a_kn^k Var(p)+ \sum_{k=0}^K b_kn^k  [Var(p)]^2 \ \ \ \ (10)

Это уравнение является основой для нашего эмпирического измерения распространенности инсайдерской торговли. Оно разбивает рыночный спред D на дополнительные составляющие. Термин z(n - 1) можно интерпретировать как часть D, которая может быть "напрямую" отнесена к z. Другие термины можно рассматривать как корректирующие термины, которые измеряют косвенное влияние z на вектор p. Таким образом, мы можем рассматривать эти термины как "фильтр" в том смысле, что они отфильтровывают влияние вектора p на D. Тот факт, что прямой эффект z(n - 1) заключается в увеличении числа участников забега, имеет интуитивное объяснение. При фиксированной ставке в один фунт у Инсайдера остается 1/\pi_i фунтов, где i - выигрышная лошадь. Следовательно, выигрыш Инсайдера будет большим при большом количестве участников (так что на лошадей предлагаются более высокие коэффициенты). Поскольку букмекеры должны быть безубыточны в ожидаемые сроки, они повышают свою маржу, чтобы возместить свои убытки Инсайдеру.

Хотя (10) раскладывает D на аддитивные компоненты, Var (p) непосредственно не поддается наблюдению, и мы должны найти процедуру, которая делает уравнение (10) эмпирически работоспособным. Первой мыслью может быть вычисление нормализованных цен.

\tilde{\pi}_k=\pi_k/\sum_i\pi_i и использование вектора нормализованных цен \tilde{\pi} в качестве показателя истинных вероятностей p. При условии, что z невелико, мы можем ожидать, что \tilde{\pi} будет хорошим показателем для p. Однако " favourite-longshot" смещение будет означать, что X систематически отклоняется от p, даже если на практике это отклонение может быть небольшим.

Эта проблема может быть решена путем использования нашего явного решения для равновесных цен \pi. Из (5) видно, что сумма квадратов нормализованных цен \tilde{\pi_k} равна

[z+(1-z) \sum_i p_i^2]/\beta. В свою очередь, Var(\tilde{\pi}) может быть записан в

терминах этой суммы квадратов как (\sum_i p_i^2/n)-(1/n^2). Подставляя

\sum_i \tilde{\pi_i}^2 и перестраивая, мы получаем выражение для Var (p) в терминах

Var(\tilde{\pi}) следующим образом:

Var(p) =  \frac{\beta}{1-z} Var(\tilde{\pi}) + \frac{\beta -1-z(n-1)} {n^2(1-z)} \ \ \ \ \ (11)

Таким образом, учитывая оценку z, мы можем вычислить Var(p) из Var(\tilde{\pi}) и других наблюдаемых величин. Это предполагает итеративную процедуру для оценки z. Она состоит из трех этапов.

Шаг 1. Используя Var(\tilde{\pi}) в качестве показателя для Var(p) в уравнении (10), получите начальную оценку z из обычной регрессии методом наименьших квадратов (10).
Шаг 2. Исходя из первоначальной оценки z, полученной выше, вычислите Var(p), используя (11). Затем используйте эти значения Var(p) для корректировки значений регрессоров в уравнении (10) и повторной оценки уравнения (10), чтобы получить пересмотренную оценку z.
Шаг 3. Повторите корректировку регрессоров в (10) и повторную оценку (10) для получения пересмотренных оценок z до тех пор, пока эти пересмотренные оценки не совпадут. Оценка z, полученная с помощью этой процедуры, будет соответствовать корректировкам регрессоров для смещения "favourite-longshot".

4. ОЦЕНКА РЕЗУЛЬТАТОВ

Данные для нашего исследования - это набор "стартовых цен", о которых сообщает ежедневная газета Sporting Life. Стартовые цены - это коэффициенты, составленные журналистами двух ежедневных изданий, Sporting Life и Sporting Chronicle, которые наблюдают за рынком на трассе в течение примерно десяти минут перед гонкой и отмечают цены, по которым принимаются ставки непосредственно перед стартом. В качестве примера мы приводим серию забегов, проведенных в Соединенном Королевстве на неделе с понедельника 1 июля 99-го по субботу 6 июля 99-го , о чем сообщалось в "Спортивной жизни" со вторника 2 июля по понедельник 8 июля Июль. В нашей выборке 36 гонок. Интерес представляют некоторые сводные статистические данные по выборке. Удивительно, что в нашей выборке есть гонка, в которой сумма цен на самом деле меньше единицы. Это в 14:15 в Ярмуте 3 июля, когда сумма обратных коэффициентов составляла 0.987.

Сумма цен

Частота

< 1.0

1

1.0 ~ 1.1

21

1.1 ~ 1.2

68

1.2 ~ 1.3

30

1.3 ~ 1.4

10

1.4 ~ 1.5

2

1.5 ~ 1.6

4

> 1.6

0

Это явно аномалия в системе коэффициентов. Одно из возможных объяснений заключается в том, что коэффициенты ставок в тот или иной день у разных букмекерских контор отличались, и стартовые цены были рассчитаны на основе самых дешевых из доступных. Эта аномалия наглядно иллюстрирует степень ценовой конкуренции на рынке ставок. Обратите также внимание на то, что распределение сильно смещено влево, причем основная часть наблюдений приходится на диапазон 1.0 - 1.3. Это делает объяснение выбросов особенно важным.

Рисунок 2
Рисунок 2

Когда выборка группируется по количеству участников, это приводит к следующему распределению частот. Как и в случае с распределением суммы цен, оно также значимо смещено влево. Уравнение (10) предполагает, что существует положительная корреляция между количеством участников и суммой цен, и вызывает подозрение, что хвосты обоих распределений состоят из одних и тех же наблюдений. Мы увидим, что это подозрение вполне обосновано.

Первая практическая проблема, с которой мы сталкиваемся при реализации процедуры итеративного оценивания, заключается в том, как усечь многочлены в (10) . Мы подойдем к этому вопросу прагматично и получим оценки z для различных спецификаций и сравним результаты. Если оценка z устойчива к изменениям в спецификации оцениваемого уравнения, у нас были бы веские аргументы в пользу выбора более экономной спецификации с использованием полинома низкой степени. На самом деле, как мы увидим ниже, оценка z практически не меняется при изменении степени многочленов в (10). По этой причине квадратичный случай является важным эталоном. Результаты итерационной процедуры оценки для квадратичного случая представлены в таблице 1.

Таблица 1. OLS регрессия уравнения после N корректировок регрессоров.* - значимость на 5% уровне** - значимость на 1% уровне129 степеней свободыв скобках - t-score
Таблица 1. OLS регрессия уравнения

D=z(n-1)+ \sum_{k=0}^K a_kn^k Var(p)+ \sum_{k=0}^K b_kn^k  [Var(p)]^2

после N корректировок регрессоров.
* - значимость на 5% уровне
** - значимость на 1% уровне
129 степеней свободы
в скобках - t-score

Первоначальная оценка z получена на основе обычной регрессии наименьших квадратов (10), в которой Var(\tilde{\pi}) используется в качестве показателя для Var(p). Она приведена в первом столбце таблицы 1. Эта регрессия дает первоначальную оценку z, равную примерно 2-5 %. Стоит отметить, что наша оценка z значима на уровне 1%, что подтверждает главный вывод нашей теоретической модели о том, что сумма цен положительно коррелирует с количеством участников. Последовательные регрессии уравнения (10) после корректировки регрессоров отображаются в последовательных столбцах таблицы 1. Наши пересмотренные оценки z сходятся с точностью до пяти знаков после запятой после трех итераций и составляют 2 %.

Одной из примечательных особенностей таблицы 1 является то, что "фильтрующие" переменные, т.е. переменные, которые включают Var(p), приобретают значимость после первой корректировки. Сравнивая первую и вторую колонки, мы видим, что значения этих переменных заметно увеличиваются, причем две из них становятся значимыми на уровне 5%. Это, по-видимому, является убедительным эмпирическим подтверждением процедуры корректировки, принятой в статье. Теперь мы обратимся к надежности нашей оценки z, поскольку изменим спецификацию расчетного уравнения. Была выполнена серия оценок, в ходе которых степень полиномиальной аппроксимации в (10) повышалась на каждом шаге. Для каждой степени полинома и для каждого раунда итерации была отмечена оценка z. Эти оценки величины z представлены в таблице 2.

N = 0

N = 1

N = 2

N = 3

Quadratic

0.02464

0.02079

0.02068

0.02058

Cubic

0.02513

0.02033

0.02029

0.02029

Quartic

0.02517

0.02013

0.02040

0.02039

Quintic

0.02497

0.02043

0.02069

0.02068

Таблица 2. Даны оценки z: (i) степень полиномиальной аппроксимации (строки) и (ii) количество итераций (N) при корректировке регрессоров (столбцы).

Столбцы указывают количество итераций, а строки - степень полинома в расчетном уравнении. Последний столбец этой таблицы особенно примечателен, поскольку содержит окончательные оценки z для каждой спецификации. Поразительно, что эти оценки практически идентичны. Действительно, нижняя правая оценка z (для квинтичного случая) с точностью до 5 знаков после запятой идентична оценке в квадратичном случае. В свете этих данных квадратичная спецификация, рассмотренная выше, приобретает особое значение в качестве эталонного примера, и, по-видимому, у нас есть веские основания доверять оценке z, которую она предоставляет. Мы завершаем этот раздел обсуждением альтернативных процедур оценки. Полиномиальные аппроксимации, подобные используемой здесь, стали менее популярны среди практиков, поскольку стали доступны более мощные процедуры нелинейного оценивания. Однако для наших целей линейная спецификация имеет ряд преимуществ. Главным из них является тот факт, что он обеспечивает аддитивную декомпозицию рыночного спреда. Распределяя D между "прямым" эффектом из-за инсайдерской торговли и "косвенным эффектом" из-за равномерности совпадения, мы можем сравнить эффект z в двух забегах с разным количеством участников. Это распределение хорошо согласуется с центральной особенностью теоретической модели, а именно с тем, что сумма цен увеличивается с увеличением числа участников, поскольку букмекер пытается компенсировать инсайдеру большие убытки за счет повышения цен, с которыми сталкиваются аутсайдеры. Наша линейная оценка z позволяет оценить крутизну этой зависимости. Тем не менее, если бы оценка z не была устойчивой к альтернативным вариантам усечения полинома, у нас не было бы иного выбора, кроме как использовать прямую нелинейную процедуру оценки. В случае, как показано в таблице 2, наша оценка z оказывается нечувствительной к точному заданию полинома. В целом, однако, нет гарантии, что процедура, используемая в этой статье, даст удовлетворительные результаты, и в будущих исследованиях следует изучить нелинейные методы оценки.

V. ЗАКЛЮЧЕНИЕ

В результате нашего эмпирического исследования мы пришли к выводу, что частота инсайдерской торговли на первой неделе июля 1993 года составила около 2 %. Ключевой эмпирической характеристикой, лежащей в основе этой статьи, была сильная положительная корреляция между суммой цен и количеством участников. Любая альтернативная учетная запись на рынке ставок должна была бы предоставить убедительное альтернативное объяснение этой функции.

Референсы

Dowie, J. (I976). 'On the efficiency and equity of betting markets.' Economica, vol. 43, PP. I39-50

Eisenberg, E. and Gale, D. (I959). 'Consensus of subjective probabilities: the pari-mutuel method.' Annals of Mathematical Statistics, vol. 30

Jockey Club Committee of Inquiry (1 968). The Racing Industry. London: Trustees of the Jockey Club.

Shin, H. (I99I). 'Optimal betting odds against insider traders.' ECONOMIC JOURNAL, vol. 101

Комментарии (0)