Аннотация

Наши результаты показывают, что подсчет результатов очного голосования на московских выборах муниципальных депутатов в 2022-м году был честным или практически честным. Подсчет же результатов дистанционного электронного голосования (ДЭГ) проходил с нарушениями — это видно, например, по аномалиям в том, как распределены голоса за кандидатов во времени. С четырех часов в пятницу до ночи с субботы на воскресенье голоса фальсифицировались в пользу некоторых кандидатов, большинство из которых принадлежит “системной оппозиции”: КПРФ, ЛДПР, СРЗП и партии “Новые люди”.

Мы оцениваем количество депутатов, за которых были вбросы, минимум в 115 человек. За этих 115 человек согласно нашей модели было вброшено около 95 тысяч голосов.

Очные выборы мундепов в Москве в первом приближении честные (или нам не удалось поймать фальсификации)

I. Явка и результат административных кандидатов не коррелируют

В прошлом на российских выборах в некоторых регионах (в т. ч. в Москве) на некоторых УИКах вбрасывали бюллетени, за счет этого росла явка и рос результат партии или кандидата, за которых вбрасывали бюллетени. 

(УИК — участковая избирательная комиссия; метонимически обозначает избирательный участок).

За счет этого возникали:

  1. Корреляция явки и “провластного” результата;

  2. Разделение всех УИКов на два кластера: с высокими явкой и провластным результатом и с явкой и провластным результатом пониже.

Как это выглядит, можно увидеть, например, здесь.

В этот раз ничего такого на очных участках не видно или почти не видно: разделения УИКов на два кластера нет; есть участки с очень высокой явкой и высоким результатом Единой России и Моего района, но они единичны, и это вполне может быть вызвано естественными причинами (рис. 1).

Рис. 1
Рис. 1

II. У явки нет пиков на круглых числах

Когда на участках полностью рисуют явку и результат (придумывая их), в явке и результатах чаще, чем по случайности, встречаются целые (и особенно круглые) числа процентов. Этот феномен (т. н. “пила Чурова”) был заметен, например, на референдуме о поправках в Конституцию.

Мы проверили, не является ли количество УИКов с целой явкой на этих этих выборах аномально высоким. Оказалось, что нет.

Для этого мы использовали методику из статьи Kobak, Shpilkin, Pshenichnikov, 2016.

Для каждого УИКа мы моделируем явку на нем, используя биномиальное распределение с n = кол-во зарегистрированных на этом участке избирателей и p = заявленная явка. Иными словами, модель заключается в том, что каждый избиратель приходит на избирательный участок с вероятностью, равной итоговой явке. Если для какого-то УИКа была нарисована явка, она останется примерно такой же и в модели, но модель не будет предпочитать целые числа нецелым.

Мы моделируем эту ситуацию достаточно больше количество раз (в нашем случае — 10 000) и создаем доверительный интервал. В случае “пилы Чурова” количество УИКов с круглой или целой явкой должно выходить за пределы доверительного интервала.

Но ничего такого мы не наблюдаем (рис. 2).

Рис. 2
Рис. 2

В основном кластере УИКов за границы доверительного интервала выходит только одна точка (на 12%), что даже меньше ожидаемых 5% (15 точек на отрезке 0% – 30%).

Если считать “целой” явку, равную целому числу ± 0,05%, то количество УИКов с “целой” явкой не отличается статистически значимо от ожидаемого (р = 0,06).

Мы проверили отсутствие аномалий и для других значений допустимого отклонения от целого числа процентов, внутри которого мы считаем явку “целой”. Для этого для каждого допустимого отклонения мы посчитали количество УИКов с “целой” явкой и z-score для него — число стандартных отклонений от среднего количества таких УИКов по всем моделям. Для z-score мы посчитали 95%-й доверительный интервал. Реальное количество УИКов с целым числом процентов ни разу не выходит за пределы доверительного интервала (рис. 3).

Рис. 3
Рис. 3

Поскольку на участках, на которых рисуют явку, скорее всего, рисуют и результаты, можно ожидать, что и у Единой России/другой провластной партии будут пики результатов на целых и круглых числах. Но и этого мы не видим (рис. 4).

Рис. 4
Рис. 4

Результаты ДЭГа странным образом отличаются от результатов очного голосования

I. У КПРФ, ЛДПР, СРЗП и Новых людей есть много кандидатов со странно высокими результатами по ДЭГу

Мы проверили, есть ли для ДЭГа корреляция между явкой в округе и результатом какой-либо партии в этом округе. “Глазами” ее не видно (коэффициенты корреляции мы не считали) (рис. 5). 

Рис. 5
Рис. 5

Зато у нескольких партий “системной оппозиции” (КПРФ, ЛДПР, СРЗП, Новые люди) есть группы кандидатов на УИКах с типичной явкой, но с заметно большим результатом, чем в основном кластере (рис. 6).

Рис. 6
Рис. 6

Само по себе это не очень странно: некоторые кандидаты просто могут быть сильно популярнее среднего по их партии, но на таких же диаграммах для результатов очного голосования таких выделяющихся из основного кластера групп кандидатов не видно.

II. Результат некоторых кандидатов по ДЭГу в разы больше, чем по очному голосованию

Теперь рассмотрим результаты отдельных кандидатов (рис. 7). Результат кандидата — это доля бюллетеней, в которых за него была поставлена галочка. 

Рис. 7
Рис. 7

Во-первых, здесь видно, что у большого количества партий средний кандидат получает по ДЭГу результат ниже, чем по очному голосованию. Видимо, это связано с тем, что в среднем в бюллетене ДЭГа меньше галочек: 2,7 против 3,3 в очном голосовании.

Во-вторых, у некоторых партий (СРЗП, ЛДПР, Новые люди, КПРФ, Коммунисты России) есть кандидаты, результат которых по ДЭГу в разы больше, чем по очному голосованию (рис. 8).

Рис. 8
Рис. 8

Самый яркий пример такого кандидата — Сергей Александрович Финик, баллотировавшийся во втором избирательном округе района Косино-Ухтомский, набравший по очному голосованию 13 голосов (0,6%), а по ДЭГу — 2184 голоса (33%), но занявший в итоге шестое место и не прошедший в совет депутатов.

III. Кандидаты с большим отношением результатов по ДЭГу и очному голосованию занимали по очному голосованию не первые места.

Рангом кандидата здесь и далее мы называем место, которое он занял по результатам голосования. 

Можно видеть, что у представителей “системной оппозиции” встречаются высокие, и иногда очень высокие, отношения результатов по ДЭГу к результатам по очному голосованию (рис. 9), при этом они встречаются у не самых популярных (очно) кандидатов.

Рис. 9. Оранжевым нарисованы медианы
Рис. 9. Оранжевым нарисованы медианы

IV. Из-за ДЭГа эти кандидаты перемещаются на места выше, некоторые получают мандат

Кандидаты с высоким отношением результатов по ДЭГу и по очному голосованию перемещаются на более высокие (по сравнению с очным голосованием) ранги по итоговым результатам (рис. 9 и 10). Особенно хорошо это видно на примере ЛДПР — там на первых местах есть только такие кандидаты.

Рис. 10. Оранжевым нарисованы медианы
Рис. 10. Оранжевым нарисованы медианы

В результатах ДЭГ самих по себе есть аномалии, указывающие на фальсификации

I. Аномалия в пятницу

Приблизительно в четыре часа дня в пятницу около 20 минут в ДЭГ вообще не поступали голоса; после интенсивность поступления голосов за некоторых кандидатов резко выросла (рис. 11, см. на скачок в количестве голосов в минуту у прошедших кандидатов от “системной оппозиции”).

Рис. 11. Оранжевым отмечены кандидаты, получившие мандат
Рис. 11. Оранжевым отмечены кандидаты, получившие мандат

Например, такое произошло с единственным прошедшим кандидатом от Коммунистов России, Екатериной Сергеевной Бакашевой, баллотировавшейся в третьем избирательном округе района Южное Тушино.

Для каждого кандидата мы рассчитали разницу в среднем количестве голосов в минуту за 2,5 часа до и после сбоя в пятницу(рис. 12).

Рис. 12. Красным отмечены значения, выделившиеся в отдельный кластер
Рис. 12. Красным отмечены значения, выделившиеся в отдельный кластер

Видно, что для большей части кандидатов эта разница близка к нулю или отрицательна, т. к. общая интенсивность голосования падала в это время, но есть “хвост” из тех, у которого эта разница положительна, т. е. за них голосовали после сбоя интенсивнее, чем до.

Просто глядя на гистограмму, хочется выделить в “хвост” всех кандидатов с разницей больше примерно 0,1, но мы решили разделить эти данные на два кластера алгоритмом k-means. В отдельный кластер выделились значения больше примерно 0,37, и мы оставили разделение таким.

В этот кластер вошло 108 кандидатов. Из них 29 от КПРФ, 27 от Новых людей, 23 от СРЗП, 22 от ЛДПР, 3 от Единой России, 2 от Моего района, 1 от Коммунистов России и 1 самовыдвиженец. 

Затем мы нормировали количество голосов, полученное отдельными кандидатами в каждую минуту, на общую интенсивность голосования в эту минуту. Для каждого кандидата мы взяли получившиеся значения за 2 часа до сбоя и 2 часа после (отступив на 20 минут, чтобы не захватывать голоса, которые приходили во время сбоя) и провели на них тест Манна-Уитни, сделав поправку Холма на множественные сравнения. 

Для критического значения р = 0,05 можно отвергнуть гипотезу о том, что результаты до и после сбоя приходят из одного распределения, для 115 кандидатов, 103 из которых входят в тех 108, которых мы выделили кластеризацией. 

Мы считаем более надежным этот статистический тест и далее работаем с кандидатами, которых он выделил.

Среди этих 115 человек снова всего три человека из Единой России и два — из Моего района, и там все еще больше всего “системной оппозиции”: 34 кандидата от КПРФ, 27 — от Новых людей, 23 — от ЛДПР из 23 от СРЗП, а еще два самовыдвиженца и одна кандидатка от Коммунистов России.

Мы выделили полученных кандидатов на графике (рис. 13). Действительно, у них виден “подскок” приблизительно в 16:00 в пятницу.

Рис. 13. Красным отмечены кандидаты, за которых мы нашли вбросы тестом Манна-Уитни
Рис. 13. Красным отмечены кандидаты, за которых мы нашли вбросы тестом Манна-Уитни

II. После аномалии в пятницу ДЭГ фальсифицировали до ночи с субботы на воскресенье

Чтобы понять, как долго продолжались фальсификации в пользу этих кандидатов, мы повторили вот этот график. Предположительно, за кандидатов от Умного голосования вбрасывать голоса не будут, и их результат можно использовать как контроль. 

Мы построили график отношения суммарного количества голосов за всех кандидатов, за которых мы нашли вбросы, к суммарному количеству голосов за всех кандидатов, выдвинутых УмГ, от времени (рис. 14).

Видно, что это отношение резко подскакивает как раз после сбоя в пятницу, но возвращается к таким же значениям, как до сбоя, ночью с субботу на воскресенье. Мы считаем, что программа, которая вбрасывала или перебрасывала голоса, работала как раз этот промежуток времени.

Рис. 14
Рис. 14

То, что нет корреляции явки на ДЭГ с результатами каких-нибудь партий (см. выше), свидетельствует в пользу того, что голоса не добрасывались, а перебрасывались между кандидатами. 

Чтобы это проверить, мы построили график количества поступивших в ДЭГ голосов от времени (рис. 15). 

Видно, что после сбоя в пятницу есть резкий “подскок” числа голосов (видимо, это пришли голоса, которые не проходили в сбой), но после интенсивность голосования возвращается к уровню до сбоя. Это тоже свидетельствует в пользу гипотезы о перебросе голосов, но мы не можем быть в этом уверенными, поскольку нам неизвестен размер эффекта, который мы ищем. Далее мы приводим нашу оценки количества вброшенных голосов за 115 ранее выделенных кандидатов, это около 95 000 тысяч галочек. Если вбросы проходили равномерно вторую половину пятницы и субботу, исключая ночь, в минуту вбрасывали около 65 голосов — эффект, который невозможно обнаружить на нашем масштабе.

Рис. 15
Рис. 15

III. Оценка количества сфальсифицированных голосов.

Мы смоделировали для каждого кандидата его результат при честном подсчете голосов. Для каждой партии мы рассчитали среднее количество голосов, которое кандидат от нее получает в каждую минуту. Для такого “среднего” кандидата мы рассчитали количество голосов, которое он получил за три дня (M3), и количество голосов, которое он получил в воскресенье с четырех утра (Mвоскр).

Далее мы делаем два допущения:

  1. В воскресенье подсчет голосов был честным;

  1. При честном голосовании у двух кандидатов от одной партии на протяжении всего голосования сохраняется отношение результатов.

Пункт 2, очевидно, является только приближением. 

Для каждого кандидата мы тоже считаем количества голосов, которое он получил по ДЭГу за все три дня (C3) и за воскресенье(Cвоскр).

После для каждого кандидата мы рассчитываем ожидаемое количество голосов за него по формуле Cвоскр × M3 / Mвоскр.

Затем для каждого кандидата считаем разницу между реально полученным количеством голосов и смоделированным. Для кандидатов, за которых были вбросы, эта разница будет приблизительно отражать количество вброшенных бюллетеней (и будет, видимо, меньше него, поскольку вброшенные бюллетени повышают среднее количество бюллетеней за кандидата от этой партии за три дня).

Для 115 человек, которых мы выделили раньше, сумма смоделированных выброшенных голосов равняется 94 590 (около 2% всех галочек в ДЭГ). 

Если наша модель адекватно отражает реальность, это оценка снизу. Во-первых, тестом Манна-Уитни мы отобрали только часть кандидатов, за которых были вбросы. Во-вторых, если кандидаты, за которых вбрасывали бюллетени, составляют значительную часть от всех кандидатов партии, это снижает оценку вброшенных бюллетеней; если в партии за всех бюллетени вбрасывали пропорционально, наша модель этого не заметит.

Далее мы посмотрели, какую долю бюллетеней для каждого кандидата составляют “вброшенные”, т.е. на какую долю смоделированный результат отличается от получившегося (рис. 16).

Рис. 16
Рис. 16

Можно видеть, что для ЛДПР, СРЗП и Новых людей распределение выглядит бимодальным. Мы предполагаем, что правый кластер — как раз те, за кого вбрасывали бюллетени.

IV. Аномалия в воскресенье

В воскресенье в 13:41–13:42 кандидаты получали сильно больше голосов, чем в соседние минуты (рис. 15). Суммарно в эту минуту было получено 18 919 голосов, тогда как максимум за 2 часа до и 2 часа после — 1334.

В нашей модели мы считаем, что для каждого кандидата количество голосов в минуту приходит из распределения Пуассона. Это распределение описывает ситуацию, в которой случайные независимые события (в данном случае голоса) происходят с постоянной средней интенсивностью (мы решили, что за 4 часа она не поменяется настолько, чтобы эта модель перестала работать): тогда количество каких-то интервалов времени (в нашем случае минут), в которые произошло 0, 1, 2 и т. д. событий оказывается распределено по Пуассону.

Для каждого кандидата мы получили параметр этого распределения, усреднив количество голосов за него за 2 часа до и 2 часа после аномальной минуты, исключая ее саму. Затем мы посчитали вероятность, что в эту минуту кандидат получит столько же или больше голосов, чем он получил на самом деле, если количество голосов в эту минуту подчиняется тому же распределению, что в остальные. Мы сделали поправку Холма и получили список кандидатов для критического уровня значимости 0,05, для которых мы принимаем гипотезу о том, что количество голосов в эту минуту аномально велико. В нем оказалось 1499 человек. 

В эти 1499 человек входят 107 из 115 человек из тех, у кого было аномально много голосов в пятницу после сбоя.

В этом списке оказалось 825 кандидатов от ЕР, 165 от КПРФ, 128 самовыдвиженцев, 105 от Новых людей, 84 от СРЗП, 74 от Моего района, 61 от ЛДПР, 35 от Коммунистов России, 10 от Яблока, 9 от Зеленых, 2 от РПСС и 1 от Партии возрождения России.

Кандидаты от разных партий входят в этот список с разной вероятностью (тест χ2, р = 6 × 10−298). В этом списке непропорционально много кандидатов от Единой России и от Моего района, от остальных партий непропорционально мало.

Так как голос не за конкретного, а за любого кандидата — тоже Пуассоновская величина, мы можем использовать тот же способ, чтобы оценить общее количество вброшенных голосов в эту минуту. С вероятностью 95% “честных” голосов в случайную минуту днем в воскресенье будет 920 или меньше, а значит мы оцениваем количество вброшенных в 18 тысяч. 

V. Аномалии в типах бюллетеней

ДЭГ сохраняет порядок, в котором избиратель отмечает кандидатов. 

На рис. 17 мы визуализируем бюллетени в округе, где избирался Сергей Александрович Финик, получивший в 60 раз более высокий результат по ДЭГ, чем по очному голосованию.

Рис. 17. Каждый бюллетень — очень тонкий столбец на этом рисунке, в котором цветом обозначены партии кандидатов, которые в нем отмечены. Бюллетени с одинаково отмеченными партиями собраны вместе, поэтому ширина одинаково раскрашенной колонки отражает количество бюллетеней такого типа. Например, самая левая колонка на рисунке — это бюллетени с единственным голосом за кандидата от Единой России, а самая правая — бюллетени с пятью голосами за самовыдвиженцев
Рис. 17. Каждый бюллетень — очень тонкий столбец на этом рисунке, в котором цветом обозначены партии кандидатов, которые в нем отмечены. Бюллетени с одинаково отмеченными партиями собраны вместе, поэтому ширина одинаково раскрашенной колонки отражает количество бюллетеней такого типа. Например, самая левая колонка на рисунке — это бюллетени с единственным голосом за кандидата от Единой России, а самая правая — бюллетени с пятью голосами за самовыдвиженцев

Можно видеть, что большая часть голосов за СРЗП (партия Финика) получена из бюллетеней, в которых идут два голоса за Единую Россию, голос за СРЗП и снова два голоса за ЕР. 

Для каждого избирательного округа мы решили найти такие вот странные бюллетени, где только одна галочка поставлена не за Единую Россию или Мой район, и бюллетеней такого типа много.

Для этого для каждого избирательного округа для каждого типа бюллетеней (тип бюллетеней = совокупность кандидатов в определенном порядке) мы рассчитали количество бюллетеней.

Полученные количества мы кластеризовали алгоритмом k-means. Для каждого округа выделили два кластера: типы бюллетеней с большим количеством бюллетеней (таких обычно немного), и типы бюллетеней с небольшим количеством бюллетеней (таких больше). 

Из всех типов бюллетеней, попавших в первый кластер в своем округе, мы выделили те, в которых только один кандидат был не из Единой России или Моего района. 

Мы нашли 65 таких “странных” кандидатов: 18 от ЛДПР, 17 от КПРФ, 16 от Новых людей, 12 от СРЗП, 1 от Коммунистов России и 1 самовыдвиженец. 41 кандидат из этих 65 входит в список из 115 человек, который мы выделили тестом Манна-Уитни. 

У этих 115 людей непропорционально часто встречаются аномалии в типах бюллетеней (тест χ2, р = 5 × 10−56). Если бы эти события были независимы, мы ожидали бы увидеть менее двух людей в пересечении.

Мы думаем, что то, что не все кандидаты с аномалиями в типах бюллетеней имеют p-value менее критического в тесте Манна-Уитни, связано с низкой мощностью теста.

Наши выводы и гипотезы

I. Количество сфальсифицированных голосов

Мы оцениваем (снизу) количество сфальсифицированных голосов за период с 16 часов в пятницу до 4 часов воскресенья в 94 590.

Количество сфальсифицированных голосов во время аномалии в воскресенье мы оцениваем в 18 тысяч.

II. Природа фальсификаций

Мы хотим различить три способа фальсифицировать результаты выборов:

  1. Вброс целых бюллетеней с желаемым содержанием;

  2. Доставление в бюллетени галочек за нужных кандидатов (под видом переголосования);

  3. Редактирование бюллетеней с переставлением галочек (под видом переголосования).

Преобладание бюллетеней с конкретным порядком кандидатов — свидетельство в пользу первой или третьей гипотезы. Аномалия в воскресенье свидетельствует в пользу первой и второй, но возможна и при истинности третьей гипотезы, если при редактировании бюллетеней галочек становится в среднем больше. Отсутствие корреляции явки с результатами кандидатов от “системной оппозиции” и отсутствие видимого изменения в интенсивности голосования свидетельствуют против первой и второй гипотез, но слабо, поскольку и ожидаемый эффект при таком количестве вброшенных голосов довольно слабый.

На выборах 2021-го года московский ДЭГ в определенный промежуток времени превращал (под предлогом переголосования) бюллетени за оппозицию в бюллетени за провластных кандидатов (раз, два). 

Логично предположить, что способ фальсификаций не сильно изменился, поэтому мы склоняемся к гипотезе 3.

III. Смысл фальсификаций

Большая часть найденных нами фальсификаций была не в пользу Единой России или Моего района. Этому можно предложить несколько объяснений:

  1. Мы не смогли засечь нашими методами фальсификации в пользу провластных кандидатов. Возможно, они были сделаны другими методами, или же методы, используемые для фальсификаций, порождают аномалии только у других партий;

  2. Фальсификации за “системную оппозицию” нужны для создания иллюзии плюрализма;

  3. ДЭГ фальсифицировали за чем-то выгодных кандидатов;

  4. Фальсификаторы поддерживают этих кандидатов по собственным политическим соображениям;

  5. Фальсификации за “системную оппозицию” — результат осечки программ, которые должны были определить, за кого фальсифицировать. В таком случае, видимо, верен и пункт 1 — наверняка такая программа не ошибается чаще, чем ошибается.

  6. Фальсификации за непопулярных кандидатов от “системной оппозиции” нужны, чтобы отнять мандат у “невыгодных” популярных кандидатов, не вбрасывая при этом голоса за Единую Россию. Возможно, вбросы за Единую Россию в прошлом вызывали слишком большой резонанс, и в 2022-м году решили обойтись без них.

Все эти гипотезы довольно сложные и неправдоподобные, и мы, наверное, упускаем какую-то модель, которая объясняла бы все фальсификации. 

Возможно также, что в каждом округе причина фальсификаций была своя. Впрочем, это странно, поскольку фальсификации во всех округах шли по одному паттерну.

IV. Чему мы пока не можем найти объяснение

  1. Изменение среднего количества галочек в бюллетенях ДЭГа приблизительно в 13:35 субботы.

Среднее количество галочек в бюллетенях ДЭГа практически не изменялось в пятницу, особенно в первую половину дня, видимо, поскольку бюллетеней приходило очень много. 

Оно колеблется по утрам и вечерам, а еще довольно резко падает в субботу приблизительно в половину второго (рис. 18).

Мы не делали статистические тесты, проверяющие значимость этого падения, и, возможно, оно вызвано естественными причинами.

Рис. 18
Рис. 18

Комментарии (10)


  1. Not_Cat
    11.09.2023 13:40

    Классика


  1. Terverus
    11.09.2023 13:40
    +1

    Отличная работа! Жаль дальше этой статьи выводы никуда не пойдут.

    "Очень удобно" - говорят чиновники про новое электронное голосование, но я так понял и редактировать галочки тоже стало гораздо удобнее, моментально и одной кнопкой. Одни плюсы короче.

    Хорошо бы такой анализ был доступен и для свежих голосований сентября 2023.


    1. Hodgkin Автор
      11.09.2023 13:40
      +1

      Сделаем! Не обещаю, что быстро, но однажды будет.


  1. c3gdlk
    11.09.2023 13:40

    Для того чтобы сравнивать очное голосовани и ДЭГ нужно иметь уверенность, что у них совпадает распределение по социологическим признакам. Возраст, уровень дохода и так далее. Могу сделать предположение, настолько же необоснованое, как и Ваше исследование, что просто онлайн голосовали более молодые люди, которые начитались всякой "либеральной чепухи" в этих ваших интернетах и голосовали за любого, кто не из ЕР.

    Про время голосования тоже странно. С чего там взяться номальному распределению? Я проснулся, увидел напоминание в почте, решил что сейчас не хочу и забыл. Потом уже опять увидел, когда почту проверял. Так что всплески вполне могут быть связаны с тем, что все проверяют почту утром и в районе обеда.

    Сторонний софт не может накручивать. Там СМС приходит прям в момент голосования. И телефон привязан к пасспорту, а пасспорт к госуслугам. Не то чтобы невозможно, но проще использовать сандартные способы с очным голосованием.

    Хак в самом софте голосовани это теория заговора, я такое даже комментировать не буду.


    1. vassabi
      11.09.2023 13:40
      -1

      Хак в самом софте голосовани это теория заговора

      какой еще хак? это вообще-то самая главная фича


    1. Hodgkin Автор
      11.09.2023 13:40
      +4

      Для того чтобы сравнивать очное голосование и ДЭГ нужно иметь уверенность, что у них совпадает распределение по социологическим признакам.

      А оно, скорее всего, не совпадает, Вы правы. Но мы не утверждаем, что то, что результаты очного голосования и ДЭГ отличаются, является свидетельством фальсификаций. Они и должны отличаться. Странно выглядит то, что данные разделяются на два кластера: есть очень много кандидатов от партии X, результат которых очно и дистанционно отличатся примерно в одинаковое количество раз и несильно (что совершенно нормально), и есть мало кандидатов, сильно выбивающихся из этой закономерности, которые гораздо популярнее по ДЭГ. При этом в результатах очного голосования такой группки сверхпопулярных нет, популярность кандидатов распределена унимодально. Этого, естественно, недостаточно для обвинения в фальсификациях, но мы и не говорим о том, что они были, только на основании этого. Но это обращает на себя внимание — обычно естественные данные распределены не так.

      С чего там взяться нормальному распределению?

      Как я понял, Вы обвиняете нас в том, что мы предполагаем, что кривая количества голосов от времени должна выглядеть как гауссиана. Это было бы самое глупое, что только можно было бы сделать с нашей стороны. Естественно, эта кривая может быть более-менее произвольной. Но она всегда будет по крайней мере непрерывной, потому что чтобы это было не так, должен существовать единственный фактор, который совершенно одновременно подействует на очень большое количество избирателей. Посмотрите на рис. 14: чтобы такое появилось в естественных данных, одновременно (не "после обеда", а совершенно одновременно) должно увеличиться количество избирателей, голосующих за определенный набор кандидатов из "системной оппозиции", но не за кандидатов от УмГ, и этот фактор, увеличивающий количество избирателей, которые голосуют так, должен действовать равномерно на протяжении всего вечера пятницы и всю субботу и резко прекратиться в ночь с субботы на воскресенье. Вы говорите, почту проверяют. Т.е. на самом деле модель, которую Вы предлагаете, выглядит так: "избиратели, голосующие за данный набор кандидатов от "системной оппозиции" и от УмГ с 11:00 до 16:00 пятницы и в воскресенье проверяют почту одинаково часто, но позже 16:00 в пятницу и в субботу любители системной оппозиции проверяют почту ровно в два раза чаще. Не в среднем за весь этот промежуток, а в любое время этого промежутка". Кроме того, у нас есть огромный пик количества голосов в воскресенье, длящийся минуту или меньше. Если бы это была e-mail рассылка или что-то вроде того, пик был бы точно более растянутым во времени: люди увидели бы письмо неодновременно, кто-то проголосовал бы сразу, кто-то чуть позже и т.п. Кроме того, очевидно, что никакая рассылка не увеличит количество голосов в минуту в 25 раз! Никаких естественных объяснений такого пика правда нет.

      Сторонний софт не может накручивать. <...>

      У нас не хватает данных и специальных знаний, чтобы сказать, как были сделаны фальсификации, но хватает, чтобы сказать, что они были.


      1. c3gdlk
        11.09.2023 13:40
        -2

        Я не утверждаю, что фальсификации нет. Мне не нравится само статистическое исследования. Статистика может быть инструментом социологии, но не наоборот. Способа оценить количество сфальсифицированных голосов нет. А вы называете конкретную цифру и даже не даёте оценку своей погрешности. Я даже не уверен, что реальная сумма меньше или больше. Просто на основе Вашей статьи считаю, что сумма приведенная Вами это число с потолка.

        У меня есть хороший знакомый, который занимается политпропагандой во время выборов на высоком уровне. Там очень много технологий и в итоге выборы на местах очень сильно зависят от навыков тех, кто работает на местах. И в итоге этой работы результаты не ложатся ни в одно статистическое распределение.

        Со способами фальсификации тоже знаком, также как и с разработкой сложных программных систем. И, на основе своего опыта, считаю, что программной манипуляции нет.


        1. vassabi
          11.09.2023 13:40
          +1

          И, на основе своего опыта, считаю, что программной манипуляции нет

          ... каждый раз когда читаю такую фразу, вспоминаю

          классику

          у вас нет даже статистики - уровень аргументации "непробиваемый" :DDD


  1. windsurfer69
    11.09.2023 13:40
    -2

    Для тех, кто в серьез принимает статьи с анализом фальсификации выборов, сообщу такую информацию. Благодаря развитию технологий появилось много онлайн игр, да и традиционные игры типа шахмат ушли в онлайн формат. И неожиданно оказалось, что во многих играх, даже в шахматах, проявляются те же аномалии, которые борцы с фальсификациями считают подтасовками на выборах. Распределения рейтингов, результаты в турнирах соответствуют не нормальному гауссовому распределению, а дают аномальные пики на значениях кратным 100 и т.п. аномалии. Люди почему-то не ведут себя, как шары в вакууме. В связи с этим возникает вопрос - а в странах с многолетней демократией и (многолетним опытом фальсификаций) почему анализ дает такие гладкие гауссовые кривые? Может быть там фальсификация?

    Я считаю, что такие статьи (чем более от анонимных новорегов) - это попытка вмешаться в выборы в описываемой стране. И , по большому счету, таким статьям не место на habr-е.


    1. Buchachalo
      11.09.2023 13:40
      +1

      Сказал юзер с двумя комментариями зарегистрированный 7 мая. Ну такое...