К настоящему моменту накопилось досточно данных для выполнения заявленного анализа. Будут использованы данные за октябрь, ноябрь и декабрь 2021 года, поскольку эти месяцы как содержат российский эпид. сезон, так и являются однородными с точки зрения штамма вируса: в обеих странах в этот период был распространен Дельта- вариант. Данные для анализа взяты из официальных источников России и США.
Смертность и вакцинный статус
Во времена Дельта- штамма основной причиной избыточной смертности называли непривитое население: дескать, именно они заболевают Covid-19 и впоследствии умирают. Определим избыточную смертность как отношение умерших за месяц 2021 года к одноименному месяцу 2020 года. В таком случае если построить график избыточной смертности от доли непривитого населения, то мы должны получить растущую прямую, выходящую из точки (0, 0) и достигающую значения (1, 1).
Действительно, если все население привито, то избыточная смертность должна находиться в районе 0 (поскольку в таком случае практически никто не умирает), а при полностью непривитом населении смертность должна повторить значение предыдущего года. В этом разделе публикации мы построим эти графики для обеих стран и сравним с ранее выдвинутым теоретическим утверждением.
Может показаться, что задача очень проста: необходимо усредняя по стране для каждого месяца определить среднюю избыточную смертность (координата х) + долю невакцинированного населения (координата y) и нанести эти точки на график. Но в этом случае у нас будет неявная зависимость от времени, поскольку разные точки одного графика будут относиться к разным месяцам. А в разные месяцы большое количество факторов (погода, питание, спортивная активность, достаток, традиции, принятые ограничительные меры....) могут иметь разное значение, поэтому мы получим зависимость избыточной смертности от вакцинации и большого количества факторов, косвенно участвующих в виде времени.
Отдельно выделю фактор стадии эпид. процесса, который задает различное положение максимумов смертности в разных годах. Это приводит к тому, что есть как месяцы с завышенной избыточной смертностью (где был максимум в 2021 году), так и с заниженной (где был максимум в 2020 году). Например, для г.Москва максимальные значения заболеваемости отличаются от фоновых примерно в 3 раза, поэтому избыточная смертность будут колебаться в 9 раз! На фоне подобных "качелей" избыточной смертности оценки эффективности вакцинации будут содержать большие ошибки.
Казалось бы из- за действия сильных зашумляющих факторов задача превращается в нерешаемую. Но для подавления шумов мы задействуем тот же прием, который используется при анализе сильно зашумленного космического излучения.
Представьте, что у вас есть небольшой полезный сигнал в виде периодического маленького "тычка", на фоне 100- кратно превышающего его белого шума. Выделить полезный сигнал из этой совокупности практически нереально. Но если мы 100 раз сложим этот зашумленный сигнал сам с собой, то полезная составляющая усилится в 100 раз (поскольку "тычок" имеет постоянное значение), а шум ослабнет (поскольку он случаен, т.е. разнонаправлен и будет сам себя подавлять). Так можно получить полезный сигнал из сильно зашумленных данных.
Поэтому мы нанесем каждый регион на график отдельной точкой и несмотря на то, что на регионы действует большое количество переменных факторов, мы в силу их рассогласованности при усреднении получим сильно ослабленное шумовое воздействие. Поэтому точки, представляющие отдельные регионы, не имеют самостоятельного смысла, а результатом анализа можно считать только наклон регрессионной прямой (отражающей усредненное значение).
Россия
В нашей стране есть два независимых источника данных по смертности от Covid- 19: сайт стопкоронавирус и официальные отчеты Росстата. Первый дает сильно заниженные данные как по заболеваемости, так и по умершим, поэтому летальность в различных регионах из- за подобных корректировок отличается в разы. Я считаю данные сайта стопкоронавирус ненадежными и буду использовать помесячные данные Росстата. При анализе я не учитывал регионы со смертность в 2020 году ниже 1000 человек / месяц, поскольку в этом случае случайные отклонения могут ощутимо исказить статистику.
Для получения данных по вакцинации использовался сайт gogov.ru, который детализирует данные по регионам и датам. На этом сайте представлено два числовых показателя: вакцинированно и полностью вакцинированно. При построении отчетов я приводил оба значения, но рекомендую опираться на первые, поскольку их больше и как следствие статистика получается более точная.
При соединении наборов данных получены графики, каждая точка на которых представляет отдельный регион. Данные по вакцинации брались за 5 дней до начала соотвествующего месяца. Это учитывало как временной лаг для протекания болезни (-10 дней), так и отставание опубликованных данных от реального положения в регионе (+5 дней).
Голубая область задает границы 95% уверенности нахождения регрессионной прямой. Уравнения приведены для искомой регрессии.
По графикам видно, что для России ранее выдвинутое теоретическое утверждение (о том, что от Covid- 19 умирает в основном непривитое население) не соответствует действительности: в октябре и ноябре в популяции наличиствует обратная зависимость (чем больше в регионе непривитого населения, тем в нем ниже избыточная смертность), а декабрь показывает недостаточно сильную зависимость (мы ожидаем коэффициент наклона близкий к значению 1). Декабрьский рост регрессионной прямой скорее всего связан с вакцинацией бустерной дозой, которая временно понижает смертность (во втором разделе настоящей публикации вы увидите, что в США в декабре также есть отклонение в сторону эффективности вацинации).
США
Данные по вакцинации взяты с сайта Центра по контролю и профилактике заболеваний США (его роль заключается в предоставлении информации для улучшения решений в области здравоохранения). На том же сайте в другом наборе данных представлена информация о смертности от всех причин.
Дополнительным бонусом данных из США оказалось разделение населения по возрастным группам как среди вакцинированных, так и среди умерших, что позволяет более детально проаналазировать воздействие вакцинации. Позже анализируя эту разницу мы получим интересные выводы.
Графики, построенные по тем же правилам, что и для России.
По США ранее выдвинутое теоретическое утвеждение также не подтвержается: регрессионная прямая имеет обратную зависимость (т.е. чем больше в регионе непривитого населения, тем в нем ниже избыточная смертность).
Эффективность вакцинации
А теперь наконец перейдем к основной теме публикации. Мы уже косвенно оценили, что эффективность вакцинации далека от 1, поскольку для обеих стран не выполнилась исходная теория. Но все же хочется иметь какие- то более точные оценки.
Первый способ
Одну из оценок можно сделать на основании того, что рассматриваемые месяцы идут непрерывно. В этом случае если и произойдет сдвижка максимума смертности одного года относительно другого, то это в себе учтет следующий месяц. Т.е. эффективность вакцинации можно оценить как максимум разницы между 1 и средней избыточной смертности. Обращаясь к графикам США для тотально вакцинированной группы 65+, мы видим, что минимальное отклонение центра красной линии от 1 равно 0.2. Это и есть первая оценка эффективности вакцинации.
Второй способ
Ранее я говорил о большом количестве факторов, действующих в регионе. Но для отдельно взятого месяца это влияние должно быть одинаковым на обе возрастные группы (65+ и 65-). Таким образом, анализируя отличия избыточной смертности и долей для центра краной линии, можно заключить, что эффективность вакцинации в ноябре составляла примерно 0.3, а в декабре примерно 0.5. Отличия по двум месяцам скорее всего объясняются значительной долей популяции 65+, поставивших в декабре 2021 года бустерную дозу вакцины (у которой пока еще сильное воздействие на организм).
Так как по США мы имеем более правдоподобные данные заболеваемости, то можно учесть то, что за промежуточный год по официальным данным переболело ~10% населения (на практике я думаю это значение примерно в 2-3 раза выше), часть из которого не пережило заболевание. Так популяция США "приспособилась" к новому вирусу и потому в 2021 году должна иметь на 10% меньшую смертность, чем в 2020.
Вывод: эффективность вакцинации от Дельта- штамма в России и США лежит в интервале от 15% до 30%.
p.s. Проект на Github.
Update: Объясняю ложность возражения о корреляции параметров от возраста
В комментариях было выдвинуто такое возражение: прямые имеют отрицаетельный коэффициент наклона, потому что возрастные интервалы, в разрезе которых строятся графики (65+ и 65-), для разных регионов имеют различный профиль возрастной пирамиды. Как результат преобладания в регионе молодого населения (в рамках возрастного интервала), мы получаем большую вероятность того, что они не будут вакцинироваться и меньшую- что умрут.
Но в публикации рассматривается не зависимость смертности, а избыточной смертности, которая определена как отношение смертностей 2021 и 2020 годов. Если в 2021 году у популяции одного из регионов есть особенности возрастного профиля, изменяющие его смертность, то эта особенность точно также действовали в предыдущем году. Дело в том, что возрастной профиль оказывает мультипликативный эффект, поскольку при расчете смертности необходимо вероятность смертности для каждого возраста умножить на количество людей этого возраста в популяции. В итоге воздействие особенностей возрастного профиля в регионе на избыточную смертность равно 1. Например, если текущая смертность из- за специфического профиля возрастной пирамиды для рассматриваемого региона занижена (относительно других регионов), то и прошлогодняя смертность должна быть ровно во столько же раз занижена, а их отношение в свою очередь уже не зависит от возрастного профиля.
Это касается и других мультипликативных факторов, которые сохраняют свое влияние на протяжении длительных периодов (не только возрастного состава) и могут оказать влияние на смертность (так называемый факторный анализ). Если на смертность в регионе действует какой- то квазипостоянный фактор повышающий / понижающий смертность в К раз, то точно также этот фактор повышал / понижал смертность в К раз в предыдущем году. Конечно, если фактор носит аддитивный характер (например, падение метеорита или цунами в регионе разово увеличивают смертность), то избыточная смертность ощутит его влияние. Но, во- первых, подобных воздействий значительно меньше (что подтверждается практически равным нулю свободному члену в законе Гомперца), а во- вторых, мы используем процедуру усреднения для избавления от подобных случайных влияний.
Все вышесказанное позволяет заключить, что введенная в публикации избыточная смертность не зависит ни от каких специфических мультипликативных квазипостоянных региональных факторов, в том числе ни от возрастного состава, ни от уровня здоровья населения.
Комментарии (136)
SinsI
31.01.2022 19:09+4Поэтому мы нанесем каждый регион на график отдельной точкой и несмотря на то, что на регионы действует большое количество факторов, мы в силу их рассогласованности при усреднении получим сильно ослабленное шумовое воздействие. Поэтому точки, представляющие отдельные регионы, не имеют самостоятельного смысла, а результатом анализа можно считать только наклон асимптотической прямой (отражающей усредненное значение)
Не забывайте Парадокс Симпсона: нельзя усреднять регионы, сильно отличающиеся по составу/плотности населения.
Кроме того, есть причинно-следственная связь между наличием людей в группе риска и их желанием вакцинироваться - если в регионе одна здоровая молодёжь, то в нём может быть низкая доля вакцинированных (при околонулевой избыточной смертности), в то время как в регионе с одними стариками доля вакцинированных будет гораздо выше - но и избыточная смертность будет гораздо больше, так как не у всех появляется устойчивый иммунитет.
PythonAnalyst Автор
31.01.2022 20:35Я не анализировал отдельные регионы. Вывод делался на основании средней линии, которая учитывает все регионы страны.
KoteMilote
31.01.2022 23:51Сами же написали что не всё регионы брали в расчёт
PythonAnalyst Автор
01.02.2022 13:46Спасибо, что демонстрируете уровень претензий к моей публикации.
SinsI
01.02.2022 01:59+5Вот в этом и ошибка. Если у вас есть любое усреднение (в данном случае - средняя линия), то его надо проверять на однородность/однотипность усредняемых данных.
Без этого вы и получаете свой вывод "люди, принимающие лекарства от сердцечных болезней, гораздо чаще умирают от них, чем люди, не принимающие такие лекарства, т.е. эти лекарства неэффективны".
PythonAnalyst Автор
01.02.2022 13:40Т.е. вы считаете, что люди привитые от коронавируса за 10 дней до начала месяца каким- то магическим образом притягивает к себе болезнь в последующем месяце? Вы путаете причину и следствие, которые очень легко определяются по последовательности действий во времени.
SinsI
01.02.2022 18:55+1Есть корреляция между готовностью людей привится и их страхом умереть от того, что они в группе риска.
Приведу пример (все цифры выдуманы):Пусть есть два региона с равным размером населения,в первом 90% молодёжи, 10% стариков, во втором- наоборот.
Пусть смертность стариков при заражении 5%, смертность молодёжи 0.1%, поэтому старики боятся коронавируса и 90% их прививаются, а молодёжь не боится и поэтому только 10% из них прививаются.
Пусть эффективность вакцины 80%.
Пришёл новый подтип вируса, так что достаточную дозу для заражения получили 90% населения в обоих регионах.
В преимущественно молодом регионе получается добавочная смертность чуть больше 0.2%, при этом вакцинированных в этом регионе будет 18%
В преимущественно старом регионе получается добавочная смертность больше 1.1% (в 5.69 раз выше, чем в первом!) при этом доля вакцинированных в нём 82%PythonAnalyst Автор
01.02.2022 20:26Это очевидно! Посмотрите на графиках доли непривитого населения 65+ и 65-. Другой вопрос, что мы почему- то видим ОБРАТНУЮ зависимость: чем больше доля непривитых, тем ниже избыточная смертность. Вы лучше это объясните, остальное и так очевидно.
SinsI
01.02.2022 22:18+1Другой вопрос, что мы почему- то видим ОБРАТНУЮ зависимость: чем больше доля непривитых, тем ниже избыточная смертность
В примере выше именно это и показано - чем больше доля непривитых, тем ниже избыточная смертность. Что объясняется упомянутой корреляцией между числом людей в группе риска и их желанием вакцинироваться.
PythonAnalyst Автор
01.02.2022 22:51Вы считаете, что разные регионы имеют разный уровень иммунизации, потому что в них живут разные по уровню здоровья люди? Т.е. в США (да и в России) ездят по стране какие- то солдаты, проводят анализ здоровья населения и в зависимости от полученных результатов развозят людей по разным регионам? Так?
SinsI
02.02.2022 08:49Регионы, естественно, различаются по уровню здорвья.
Но точно также будет влиять и фактор плотности населения и числа заражённых - если вашу деревню посещают только два человека в месяц, то важно вакцинировать эту парочку, соответственно у вас будет низкая вакцинация и нулевая избыточная смертность даже если в этой деревне одни старики.
PythonAnalyst Автор
02.02.2022 08:57Регионы, естественно, различаются по уровню здорвья.
Спасибо, этот довод еще более серьезный, чем косточки от вишни :)
TyVik
31.01.2022 19:20+1И, к сожалению, наша статистика дискредитирована людьми, которые вместо прививки купили себе QR код.
PythonAnalyst Автор
31.01.2022 21:00Обратите, пожалуйста, внимание, что в статье сделан анализ для двух стран: России и США. Причем в обеих странах получены одинаковые результаты.
Alex_Mtrskn
31.01.2022 21:11-1Ну если бы существовали инопланетяне, то пользуясь вашим методом можно было бы получить такие же данные и для них
Hait
31.01.2022 21:16+1Как будто в США не покупали сертификаты
PythonAnalyst Автор
31.01.2022 22:19Я беседовал с одной американкой русского происхождения, которая даже хотела временно вернуться в Россию, потому что тут значительно легче купить сертификат вакцинации. Конечно, один человек не может характеризовать всю популяцию.
А вы беседовали с реальными американцами на эту тему? Было бы интересно узнать насколько сложно у них решается этот вопрос.
Hait
01.02.2022 13:32Не общался лично. По некоторым новостям выглядит так, что можно получить фейковый сертификат и в случае, когда этого не хотел:
According to court documents, in April 2021, an individual submitted a complaint to the Department of Health and Human Services Office of Inspector General (HHS-OIG) hotline stating that family members purchased from Mazi COVID-19 homeoprophylaxis immunization pellets. The complainant stated that the family members had told her/him that Mazi stated that the pellets contained the COVID-19 virus and would create an antibody response in the immune system. The complainant reported that her/his family did not receive injections of any of the three FDA-authorized COVID-19 vaccines. However, in connection with the delivery of the homeoprophylaxis immunization pellets, Mazi sent COVID-19 Vaccination Record cards, with Moderna listed, to the complainant family. Mazi allegedly instructed the complainant family to mark the cards to falsely state that they received the Moderna vaccine on the date that they ingested the COVID-19 homeoprophylaxis immunization pellets.
https://www.justice.gov/opa/pr/woman-arrested-fake-covid-19-immunization-and-vaccination-card-scheme
DonStron
31.01.2022 21:56+1И, к сожалению, наша статистика дискредитирована людьми, которые вместо прививки купили себе QR код.
а есть какая-то статистика по "покупкам"? А то может этот слух про покупки запустили сами, чтобы можно было всегда отмазаться про неэффективность вакцины, как это заявлялось в одной новостной передаче "если кто-то заболел после прививки - значит он купил QR код". Пикантность ситуации в том, что вроде бы, спустя какое-то время, сам ведуший, это утверждающий, заехал в больничку, хотя был привит.
PythonAnalyst Автор
01.02.2022 00:14Я тоже не верю, что врачи, которые САМИ вносят вакцинированных в базу данных, будут массово ставить липовые уколы: ведь их со временем по статистике заболевших вычислят. Причем врачи отлично знают, что 100% собирают подобную статистику, потому что с помощью нее анализируют качество производства и доставки вакцины (первое время для нее требовались сложные холодовые условия).
Если у врача каждый первый уколотый впоследствии заболевает, то тут ведь все предельно очевидно.
corvair
01.02.2022 05:48Сертификат можно было и не покупать, доходило до того, что в некоторых местностях, особенно на селе, по умолчанию делали фиктивную прививку, настоящую только по просьбе. Доля фиктивных прививок местами оценивалась до четверти всех вакцинаций.
Насчёт заболеет/не заболеет, ни одна вакцина не гарантирует, что не заболеешь, а вот спасти жизнь или хотя бы позволить перенести инфекцию легче, вполне может и это и есть её задача.
PythonAnalyst Автор
01.02.2022 12:11Врачи верят в эффективность медицины в целом и вакцинации в частности. Поэтому скажите, пожалуйста, зачем врачу брать ответственность за массовую гибель стариков на селе?
Еще больше мне не понятно, зачем люди придумывают подобные страшилки, их распространяют и в них верят?
Tnkr
31.01.2022 19:39Оценка эффективности вакцинации таким образом невозможна (не даст корректных результатов).
В первую очередь, из-за разных штаммов (с разной заразностью/летальностью) в разные годы.Эффективность вакцинации хорошо определяется по долям вакцинированных среди умерших от вируса (с вирусом). Когда последний раз смотрел, в Германии по этому показателю эффективность вакцинации для возрастной группы 60+ была больше 80%.
Alex_Mtrskn
31.01.2022 19:57+6Не только из-за вариантов вируса. Очень сильно влияют такие факторы как:
социальный статус людей
их статус здоровья и возраста (ясно же, что сначала вакцинировали людей из группы риска, а детей, которые наименее подвержены смерти от коронавируса, вообще не вакцинировали)
да даже банальная доступность мед обеспечения влияет - больше заболевших, меньше из них может получить квалифицированную мед. помощь и больше умирает
болел ли человек до этого коронавирусом
чем он вакцинировался тоже влияет - есть ряд вакцин, эффективность которых не доказана
В общем автор взял и сравнил несравнимое. Бездумная обезьянья работа.
PythonAnalyst Автор
31.01.2022 20:30Вы считаете, что эти факторы сильно изменились в течении года? Я анализирую отношение смертностей за два последовательных года, поэтому если считать, что эти факторы практически сохраняют свое значение, то при делении они дадут 1.
К тому же я применил усреднение по различным регионам, которое дополнительно подавляет влияние приведенных вами факторов.Alex_Mtrskn
31.01.2022 21:00+1Вы анализируете две разные когорты населения, которые между собой очень сильно отличаются. Да, за год эти когорты могли достаточно сильно поменяться - больше людей из группы риска провакцинировалось, больше людей переболело коронавирусом, в итоге меньше людей осталось и невакцинированных и не переболевших. К тому же само влияние вируса изменилось на людей - другой вариант.
Все ваши усреднения и "отношение смертностей за два последних года, которые сохраняют свои значения" - это лютый треш и содомия.
Еще раз повторю: то, что вы научились тыкать в кнопочки и использовать бьютифул суп, не делает вас датасайентистом.
PythonAnalyst Автор
31.01.2022 23:55-1Посмотрите на разные наклоны прямой для разных месяцев (я не привел в публикации график для сентября, у которого как и в декабре положительный коэффициент наклона): ваше отнесение регионов к когортам успевает поменяться за 1 месяц.
Про какие кстати когорты вы говорите, а то получается какое- то абстрактное возражение?
PythonAnalyst Автор
31.01.2022 20:33-1Идея о том, что Дельта штамм более "сильный" была вброшена чтобы оправдать повышенную смертность среди частично привитого населения: дескать, смотрите даже половина непривитого народа умирает на 30% больше, чем в прошлом году вся популяция. В публикации я показал, что утверждение о смертности только среди непривитого население является ложным, а значит ложным является и тезис о более "сильном" Дельта- штамме.
Alex_Mtrskn
31.01.2022 21:01+3В статье вы показали, что совсем не умеете в дата сайенс, обработку данных и статистику.
Port5
31.01.2022 21:34Идея о том, что Дельта штамм более "сильный" была вброшена чтобы оправдать повышенную смертность среди частично привитого населения
Во время пика заболеваемости и смертности от Дельты, который был год назад, уровень вакцинации был несравнимо ниже, чем сейчас.
PythonAnalyst Автор
31.01.2022 22:11Точно! Именно поэтому отношение смертностей двух годов может характерировать эффективность вакцинации (если подавить шумы или анализировать две группы людей находящихся в одинаковых условиях).
Port5
01.02.2022 16:21Такое сравнение имеет смысл только для тех сообществ (стран), где достигнут уровень полной вакцинации 90+ %. В противном случае доли непривитого населения более чем достаточно для распространения инфекции и создания достаточно высокой смертности.
PythonAnalyst Автор
01.02.2022 20:19-1Опровержению этого утверждения (что именно непривитое население количественно определяет избыточную смертность) посвящена первая часть моей публикации. Пожалуйста, прочитайте ее, и возможно вы больше не будете распространять не соответсвующую действительности информацию.
Port5
01.02.2022 22:14+1Пожалуйста, почитайте хотя бы википедию, и, возможно, "вы больше не будете распространять не соответсвующую действительности информацию" (с)
Вы строите каккие-то корреляции в диапазоне до доли вакцинированных 0.8, тогда как для эффективного торможения распространения необходимо больше 0.8 (см. рисунок ниже). До 0.8 инфекция будет беспрепятственно распространяться, а смертность будет по ряду причин рандомно гулять туда-сюда, а вакцинация не будет её особо тормозить. Собственно, у вас и получились случайные зависимости, не имеющие смысла. Про связь между вероятностью помереть от ковида и вакцинацией ссылок более чем достаточно (выше тоже приводили). По текущим представлениям, для Дельты вакцинация снижает вероятность склеить ласты примерно на три порядка. Однако сейчас Дельта вытесняется Омикроном, который значительно заразнее и значительно "слабее", и который теперь будет гулять среди нас постоянно. Насколько имеет смысл вакцинироваться от Омикрона это уже другой вопрос.
PythonAnalyst Автор
01.02.2022 22:43-1Столкновение практика и теоретика. У одного данные по реальной смертности и вакцинации из двух крупных стран с пониманием неполноты своих знаний и желанием разобраться, у другого откуда- то взятая теоретическая картинка и твердая уверенность в своих словах.
PythonAnalyst Автор
02.02.2022 09:14Рассмотрите 1- ого заболевшего, который заражет вокруг себя R0 человек. Эпидемия самостоятельно гаснет, когда заболевший заражает менее 1 человека, а значит вакцинированно должна быть (R0-1)/R0 = 1 - 1/R0 часть насления. Узнали своей график (из единицы вычтена отрицателная гипербола)?
смертность будет по ряду причин рандомно гулять туда-сюда, а вакцинация не будет её особо тормозить
Из ваших слов следует, что если популяция не преодолела определенный барьер вакцинации, то толку от нее нет. Но если понимать выше приведенный процесс распространения заболевания от 1 человека, то становится очевидно, что это не так: при более низком (чем необходимо для гашения эпидемии) уровне вакцинации распространение заболевания снизится (поскольку теперь человек заражает всего R0 * K человек, где К- доля невакцинированного населения).
Поэтому вакцинация на любом уровне должна снижать избыточную смертность, а на приведенных в публикации графиках (построенных по данным из официальных источников) этого не наблюдается. Как вы можете это объяснить?
Port5
02.02.2022 13:32Из ваших слов следует, что если популяция не преодолела определенный барьер вакцинации, то толку от нее нет.
Так и есть. Толк будет лишь для тех индивидуумов, которые вакцинировались.
при более низком (чем необходимо для гашения эпидемии) уровне вакцинации распространение заболевания снизится (поскольку теперь человек заражает всего R0 * K человек, где К- доля невакцинированного населения).
Это некорректное упрощение. Вакцинированные также способны передавать инфекцию (равно как и болеть), хотя период из заразности короче, чем для невакцинированных. Таким образом, вакцинация затрудняет распространение, а не исключает его полностью. Вероятность успешной передачи инфекции для пар будет расти в по порядку "вакцинированный-вакцинированный" < "вакцинированный-не вакцинированный" < "не вакцинированный-не вакцинированный". Можно записать скорость передачи инфекции между парой людей как W = k*[person1 * K]*[person2 * K], где person2 и person2 это способность распространять инфекцию у первого человека и восприимчивость к ней у второго, соответственно, а K это уровень вакцинации. Вакцинация повлияет на оба эти фактора и, вынеся её в коэффициент k, зависимость скорости от уровня вакцинации итоге получается квадратичной W = K^2. Там и других факторов много (как уже упомянутый возраст), что делает зависимость ещё хитрее.
PythonAnalyst Автор
02.02.2022 16:55Так и есть. Толк будет лишь для тех индивидуумов, которые вакцинировались.
И тут же ниже пишите:
Таким образом, вакцинация затрудняет распространение
Вы определитесь, пожалуйста, вакцинация затрудняет распространение или нет.
Port5
02.02.2022 21:40Заметный эффект (торможение) от массовой вакцинации будет наблюдаться при достижении определённого уровня, условно 0,8. Ниже этого уровня замедление распространения и уменьшение смертности будет незначительным; это именно тот диапазон, который вы использовали в своей статье.
PythonAnalyst Автор
03.02.2022 01:21Вакцинация даже на низких уровнях дает свой эффект. Представьте, что R0=4, тогда 1 заболевший заразит 4 человек. Но если популяция вакцинированна на 25%, то он заразит уже 3-ех, а при 50% вакцинированных- всего 2-ух человек (а смертность будет пропорциональна количеству переболевших). Поэтому можно говорить об эффективности вакцинации на любом ее уровне.
С помощью этой логики я выше вывел вашу же картинку. Так что эта логика верна, или вы не верите в свою картинку?
Пожалуйста, перестаньте многократно повторять одну и туже глупость.
Port5
03.02.2022 02:44смертность будет пропорциональна количеству переболевших
Прямые пропорции не работают в данном случае вообще, от слова совсем. Этот ваш базовый постулат вкорне неверен. Нет никакого "если популяция вакцинированна на 25%, то он заразит уже 3-ех", потому что вакцинированные тоже могут передавать инфекцию, пусть и менее эффективно. Передача идёт между двумя людьми, поэтому для обоих применяются поправки на вакцинацию, что даёт квадратичную зависимость (мы это обсудили выше).
Хорошая аналогия это цепная реакция (ядерная или химическая): достаточно небольшого превышения порогового значения массы/инициатора/концентрации и тд, чтобы реакция пошла со взрывным развитием. Или наоборот, моментально затормозилась при достижении пороговой концентрации ингибитора. Химическую кинетику или ядерные цепные реакции вы тоже будете опровергать, дескать там всё должно быть линейно-пропорционально?....
PythonAnalyst Автор
03.02.2022 09:08Прямые пропорции не работают в данном случае вообще, от слова совсем.
Работают, потому что это СТАТИСТИКА. У вас 100500 заболевших, которые заражают разное количество случайно- выбранных человек. Исходя из определения R0 в среднем человек имеет потенциал заразить R0 человек, в свою очередь вокруг этого заболевшего доля вакцинированных статистически ровно такая, как вакцинированно в целом по популяции. Это подтверждается вашей же картинкой.
Если вы хотите добавить в рассмотрение передачу инфекции между вакцинированными (усложнив задачу, хотя не разобрались в более простом варианте), то введите коэффициент эффективности вакцинации против заболеваемости (предположим он равен 0.2) и домножайте вакцинированных, попавших в окружение заболевшего, на этот коэффициент при расчете общего числа зараженных. Получите небольшую поправку.
Скажем при R0=4 и 25% уровне вакцинации вы получите 3 + 1*0.2 = 3.2 зараженных. Если же не было вакцинированно 25% населения, то зарозилось бы 4 человека. Видите как низкий уровень вакцинации работает (3.2 < 4), даже с поправками на передачу заболеваемости между вакцинированными?
И как эта поправка оправдывает выдуманную вами идею про наличие "барьера вакцинации"? Никак. Ваша задача добавить в рассмотриваемый вопрос сложности, чтобы запутать более глупых людей и протолкнуть свою идею барьера.
p.s. И не надо аппелировать к физике. У нас популяция, а не ядреный реактор. Это РАЗНЫЕ объекты.
p.s.s. Более не буду отвечать на ваши возражения, поскольку я максимально детально разжевал этот вопрос. Дальше можете писать любую околесицу, я ее проигнорирую.
Port5
03.02.2022 14:20Работают, потому что это СТАТИСТИКА
Статистика имеет смысл только при корректно выбранных условиях. Ииначе можно строить зависимости зарплат разработчиков в Чите от силы океанических приливов на острове Пасхи, собрать случайные данные и обсуждать их. Это именно то, что вы сделали - в диапазоне до 0,8 влияние абсолютного уровня вакцинации невелико и сильно зависит от ряда других условий (страна, возраст населения, возраст вакцинированных и тд). Поэтому у вас и получилось отсутствие зависимости. Вам уже несколько раз об этом сказали.
Скажем при R0=4 и 25% уровне вакцинации вы получите 3 + 1*0.2 = 3.2 зараженных.
Мы это уже обсудили выше, это так не работает. Этот R0 является следствием, результатом функции со многими параметрами,а не исходным условием, которое можно менять как хочешь. Т.е. R0 = 4 означает, что в выбранных условиях один человек заражает четверых. Изменение условий (вакцинация) приведёт к совсем другому R0 или не изменит его вообще.
И не надо аппелировать к физике. У нас популяция, а не ядреный реактор.
Распространение инфекции имеет характер цепной реакции, поэтому аналогии с соответствующими явлениями в физике и химии самые прямые. В таких реакциях зависимости скорости реакции (распространения инфекции) от исходных условий как правило не имеют линейного характера.
Port5
03.02.2022 15:35Скажем при R0=4 и 25% уровне вакцинации вы получите 3 + 1*0.2 = 3.2 зараженных. Если же не было вакцинированно 25% населения, то зарозилось бы 4 человека.
К слову, R0 = 4 не означает, что в период своей болезни человек контактировал исключительно с четырьмя людьми, которым он с вероятностью 100% передал инфекцию. Он мог контактировать хоть с сотней людей, но лишь в четырёх контактах передача была успешной. Поэтому если вакцинировано 25%, то среди этой сотни контактировавших людей инфекция без проблем "подберёт" себе четырёх наиболее восприимчивых из оставшихся 75%.
Tnkr
31.01.2022 22:29+1Не понятно на основаниие чего вы утверждатете Идея о том, что Дельта штамм более "сильный" была вброшена . Это не "идея", а факт подтвержденный и медицинскими и статистическими исследованиями (в тех странах где они проводятся и публикуются).
А то что утверждение о смертности только среди непривитого население является ложным и так очевидно. Тем более что никто и не утверждал что только только среди непривитого , утверждается (и подтверждается статистикой по заболеваемости/летальности) только то что смертность среди непривитого населения выше, особенно в группах риска.PythonAnalyst Автор
31.01.2022 23:50-1В публикации я показал, что избыточная смертность практически не зависит от доли непривитого населения. Т.е. для Дельта- штамма популяция практически не изменилась. Если бы Дельта- штамм был более "сильным", то в 2021 году мы видели бы кратно более высокую смертность, чего не наблюдается.
Пожалуйста, корректно ведите беседу. В публикации написано: "Во времена Дельта- штамма основной причиной избыточной смертности называли непривитое население". Я нигде не писал, о смертности только среди непривитого населения.
Tnkr
01.02.2022 00:52+21) Вам уже указали в работе вы допустили ошибки, поэтому и выводы получили неверные. Более того, они опровергаются другими real world данными.
2) Пожалуйста, будьте внимательнее. Я цитировал ваш комментарий выше в этой же ветке.
PythonAnalyst Автор
01.02.2022 01:05Аппелирование к мнению толпы, чтобы сбить стаю и вместе заклевывать 1 человека- очень низкий поступок.
nktkz
01.02.2022 00:51+1"Эффективность вакцинации хорошо определяется по долям вакцинированных среди умерших от вируса" - эта метрика не может быть искажена и дать некорректные результаты?
Alex_Mtrskn
31.01.2022 19:50+2Когда я читаю такие статьи, то у меня в голове прокручивается только один мем:
Автор, а может вы сначала попробовали бы изучить мат статистику и немного эпидемиологию/вирусологию? На данном этапе не понимая ничего вы взяли непонятно что и прогнали через мясорубку питона. Поздравляю, вы получили замиксованное нечто - абсолютно бессмысленные данные. Вы хоть проанализировали исходные данные? А свои графики?
PythonAnalyst Автор
31.01.2022 21:02Пожалуйста, приведите законы эпидемиологии / вирусологии, которые я нарушил. Я откорректирую свою публикацию, чтобы она содержала корректную информацию.
Alex_Mtrskn
31.01.2022 21:14Пожалуйста, для начала изучите хотя бы основы. Тогда будем с вами разговаривать.
Вот вам полезная ссылка: https://www.coursera.org/specializations/statistics-with-python
PythonAnalyst Автор
31.01.2022 21:31Все же я попрошу вас сообщить о нарушенных мной законах эпидемиологии / вирусологии. Я не умею искать черную кошку в черной комнате, когда ее там нет.
Вы написали о допущенных мной ошибках. Приведите их, пожалуйста.
Alex_Mtrskn
31.01.2022 21:39Я уже много раз упоминал здесь, что у вас не так. В общем все сводится к тому, что вы сравниваете несравнимые вещи. Вы не учитываете ни наличие разных вариантов вируса, ни различия в вакцинации по возрастам, ни различия влияния вируса на разные возрастные категории, ни то, что люди уже могли переболеть коронавирусом. Это и есть несоблюдение объективных эпидемиологических и вирологических показателей для анализа данных. Про "нарушение законов" это вы откуда-то додумали
PythonAnalyst Автор
31.01.2022 22:05Я анализировал НАКЛОН асимптотической линии. Если в разные годы доминирует разный вирус, то все регионы одинаково это "почувствуют" и наклон прямой не изменится.
Различие влияния вируса на разные возрастные категории проводить не нужно, потому что возрастной состав за 1 год практически не изменился (особенно если учесть, что влияет не само изменение возрастного состава региона, а разница этих изменений для разных регионов, которые еще потом и усреднятся).
То что часть людей уже переболела коронавирусом у меня утчено. Пожалуйста, будьте внимательнее.
Alex_Mtrskn
31.01.2022 22:17Надо сравнивать анализировать одинаковые категории. Иначе с чего вы взяли, что
т.е. чем больше в регионе непривитого населения, тем в нем ниже избыточная смертность
Вы сравниваете разные когорты.
Еще я немного в шоке, что же такое "эффективность вакцинации"? Что этот показатель показывает у вас?
PythonAnalyst Автор
31.01.2022 23:14В публикации я не привел графиков для сентября, поскольку этот месяц не является эпид. сезоном в России. Так вот, для сентября и декабря в России наклон средней прямой противоположен наклону прямой в октябре и ноябре.
Вы считаете, что отнесение региона к той или иной когорте меняется за 1 месяц?Эффективность вакцинации в моем определении- способность вакцины при полностью вакцинированной популяции снижать смертность в регионе.
Alex_Mtrskn
01.02.2022 04:43Вы считаете, что отнесение региона к той или иной когорте меняется за 1 месяц?
Я считаю, что делать такие выводы как вы сделали без анализа данных и влияющих факторов неверно.
Эффективность вакцинации в моем определении- способность вакцины при полностью вакцинированной популяции снижать смертность в регионе.
Интересный параметр. Если учесть, что смертность - это показатель отнесения умерших к общему числу населения (а не к количеству заболевших). То есть вы берете и вообще все смерти рассматриваете, а не только от коронавируса. Не беря в учёт, что был локдаун в стране (а это может влиять на количество смертей от аварий) и прочие конфаундеры.
PythonAnalyst Автор
01.02.2022 10:18Вы считаете, что отнесение региона к той или иной когорте меняется за 1 месяц?
Я считаю, что делать такие выводы как вы сделали без анализа данных и влияющих факторов неверно.
Вам в диалоге задали вопрос, почему бы как принято в культурном обществе не ответить на него?
Интересный параметр. Если учесть, что смертность - это показатель отнесения умерших к общему числу населения (а не к количеству заболевших)То есть вы берете и вообще все смерти рассматриваете, а не только от коронавируса.
Я анализировал отношение смертностей двух годов. Если вы проведете простенькие математические рассчеты (вычтите 1), то увидите, что этот показатель говорит о разнице смертностей в единицах самой смертности (на заболеваемость я нигде не опирался). Причем отличие двух годов было не в коронавирусе, а в наличии / отсутствии вакцинации.
Не беря в учёт, что был локдаун в стране (а это может влиять на количество смертей от аварий) и прочие конфаундеры.
Обратите внимание на раздел моей публикации, где я писал о большом количестве шумов, влияющих на результат и способе их обойти с помощью усреднения. Полагаю, что повышенная смертность в одном из регионов от аварий (аллигаторов? штормов? косточек вишни?...) не окажет влияния на результат за счет процедуры усреднения. Если у вас есть другие данные, то, пожалуйста, приведите их.
Matshishkapeu
31.01.2022 20:01+7Тащемта классический garbage in - garbage out. Ключевой предсказатель смертности от ковида для человека - возраст. Без знания того, как по возрасту распределены вакцинированные и невакцинированные выхлоп анализа ограничивается нагревом процессора. Если в одном регионе вакцинировано 30 процентов, вакциной закрыты люди старше 50 лет и там в целом молодое население ( условно Дагестан) а в другом вакцинировано 70 процентов молодых чтобы ездить в отпуск и ходить в ресторан, а составляющие значительную долю старики заряжают воду у телевизора (пусть будет МО) - то можно получить какие угодно цифры в любую сторону.
PythonAnalyst Автор
31.01.2022 20:28-3Я анализировал избыточную смертность, которая определена как отношение смертностей для 2021 и 2020 года. Поэтому если какой- то регион имеет в одном году более молодое население, то в следующем он скорее всего сохранит это отличие. Для отношений смертностей выполнять подобный анализ вполне корректно.
Alex_Mtrskn
31.01.2022 21:03Поэтому если какой- то регион имеет в одном году более молодое население, то в следующем он скорее всего сохранит это отличие.
Конечно сохранит - у вас ведь старики не умирают. Но только вот при чем тут соотношение молодого и старого населения, когда мы говорим про вакцинацию?
PythonAnalyst Автор
31.01.2022 21:09+1Старики действительно умирают, а остальное население стареет на 1 год и возрастной состав практически сохраняется.
Мы говорим о соотношении молодого и старого населения, потому что именно такое возражение мне было высказано (и я именно на него отвечал).
Alex_Mtrskn
31.01.2022 21:15-1Вам было высказано вот такое возражение:
Без знания того, как по возрасту распределены вакцинированные и невакцинированные выхлоп анализа ограничивается нагревом процессора.
А вы начали отвечать на что-то свое.
stripe
31.01.2022 20:31+1В США, начиная со второй половины декабря пошла волна новой версии Омикрона. Это хорошо видно по графикам количества заболевших (~120k (5 day avg)) в начале-середине декабря, рост с середины и ~350k на 31 декабря.
Про Россию неизвестно, но скорее всего ситуация аналогичная. Так что в этом исследовании еще и изначальная предпосылка не полностью верная.
PythonAnalyst Автор
31.01.2022 20:43+1Все- таки надо разделять понятия "появился" и "стал доминировать". Дополнительно надо учесть, что после заболевания необходимо примерно 10 дней до наступления смерти, т.е. заболевшие Омикроном в конце декабря 2021 года умерли в начале января 2022 года и не попали в мое исследование.
stripe
31.01.2022 20:57120k vs 350k - я бы сказал что на конец декабря уже доминирует омикрон, причем каков его вклад на начало декабря - нужно смотреть отдельные исследования. Пишут, что он вытесняет Дельту за счет сильно большей вирулентности
про 10 дней допустим согласен, но это неплохо было бы указать в статье
опять-же в статье говорится про общестатистические данные, никакой коррекции на время от начала заражения до теста, и от попадания в больницу до смерти не приводится.
а еще омикрон протекает легче и смертность ниже - тоже может вносить свой вклад в декабрьские данные
Хотя это конечно больше важно для статьи в научном журнале, а не на хабре
PythonAnalyst Автор
31.01.2022 21:11В статье приведена информация о сдвижке в 10 дней для протекания заболевания.
ivankomarov
31.01.2022 20:32Почему статья не работает сказали. Но и в комментах и создатели вакцин говорят о том, что при вакцине не умрешь.
Т.е. вакцина -> не умрешь. Т.е. если взять две одинаковые страны (области), в одной вакцину поставить (30-60-90% населения), в другой не делать (0%), то какую смертность можно ожидать в обоих странах? Хотелось бы разную, причем в первой стране меньшую.
Или все настолько запутано (статистически и эпидемиологически), что при вакцинации как раз и наблюдаем, что делаем вакцины, а народ мретпуще прежнеготак же как и без вакцин?Конечно, особенно поиграв в https://ncase.me/covid-19/, можно видеть, что заразность естественно всегда сильнее мер по вакцинации (да и вакцина начнет работать через 4 недели, кроме прочего). Так что видеть рост смертей среди непривитого и заболевшего населения на фоне роста вакцинации - понятный тренд. Это контр-аргумент автору.
Однако возникает вопрос, на который попытался найти ответ автор - а как можно увидеть в стране эффект от вакцинации? Отличное предложение - среди умерших смотреть % вакцинированных и смотреть на долю вакцинированного населения. Где-то есть такая статистика по Спутнику? По идее у государства есть (Госуслуги и Свидетельство о смерти).Alex_Mtrskn
31.01.2022 21:09Отличное предложение - среди умерших смотреть % вакцинированных и смотреть на долю вакцинированного населения.
Плохое предложение. Вы не учитываете, как и автор, возрастное ранжирование и ранжирование по сопутствующим заболеваниям при анализе данных. Определенно люди из группы риска будут активнее вакцинироваться, но так как они из группы риска, то и умирать они будут чаще, чем люди не из группы риска. Для примера: Мы имеем в группе невакцинированных преимущественно молодую когорту, для которой вероятность умереть 1%, а в группе вакцинированных смешанную когорту с вероятностью 5%. Допустим вакцинация предотвращает 50% смертей. Тогда получается, что вероятность умереть по такой статистике у вакцинированных будет выше, чем у невакцинированных (2,5% против 1%).
ivankomarov
01.02.2022 04:30+2А если учитывать возраст и сопутствующие (это сделать легко, если есть данные)?
И как бы вы предложили на общедоступных данных показать, что вакцина как-то влияет на смертность (вы могли бы)? Т.к. кажется на заразность она влиять слабо, да и к новым штаммам она малопригодна.
PythonAnalyst Автор
01.02.2022 14:38Если вы хотите учитывать возраст, то это можно сделать с помощью закона Гомперца. В этом случае надо показать, что кривая закона Гомперца более пологая.
Tnkr
01.02.2022 02:59+1Однако возникает вопрос, на который попытался найти ответ автор - а как можно увидеть в стране эффект от вакцинации? Отличное предложение - среди умерших смотреть % вакцинированных и смотреть на долю вакцинированного населения. Где-то есть такая статистика по Спутнику?
Публиковалось аргентинское исследование по Спутнику, еще до "Дельты" (не следил было ли еще что-то поновее). Тогда Спутник показывал значительное снижение смертности в группах риска.
Недавно появился препринт российского исследования (уже про "Дельту"), где оценили защиту Спутника V от "симптоматической коронавирусной инфекции" в 58% (но в работе авторы указывают что оценка, вероятно, занижена из-за особенности/неполноты исходных данных).Не уверен что эффект от вакцинации в целом по России вообще возможно как-то четко увидеть, слишком много постоянно меняющихся переменных влияющих на результат. И нет второй "России" где всё было бы также, но плацебо вместо вакцины.
ivankomarov
01.02.2022 04:24Не уверен что эффект от вакцинации в целом по России вообще возможно как-то четко увидеть
Вот это и расстраивает. Т.к. 1) Антиваксеры на коне, 2) Собственно автор это и показал ).
Т.е. критики кроме критики ничего не могут на данных показать, только рассказать "как надо"?
Другими словами, если (не дай бог) вакцина не работает, по стране увидим то же самое?
netAn
31.01.2022 22:01Есть методичка ВОЗ, которая совпадает с классической методикой из древних учебников по иммунологии.
Автор в посте делал не по методичке, поэтому сделал ошибочные выводы. Только зря потратил время.
Alex_Mtrskn
31.01.2022 22:20+1Ну технически можно делать и ретроспективное исследование. Но делать его надо не как автор.
PythonAnalyst Автор
03.02.2022 14:21Вы можете написать статью в соотвествии с рекомендациями ВОЗ. Я с благодарностью изучу ваш материал.
p.s. После того как я вам ответил надеюсь вы перестанете писать этот комментарий в других местах, мешая людям беседовать.
netAn
03.02.2022 16:03+1Уже написали, с нетерпенеим жду ваш комментарий.
P.S. Нет, не перестану, пока вы будете продолжать распространять ложную информацию.
ValCanada
31.01.2022 23:13+1а при полностью непривитом населении смертность должна повторить значение предыдущего года
Не уверен, что это было бы так.
Например, если у вас в первый год переболеет 100% населения и некий % самых слабых с точки зрения вируса умрет, то в следующем году умирать уже будет особо некому плюс минус погрешность.
PythonAnalyst Автор
01.02.2022 00:02Формально вы правы. В конце публикации я привел официальные данные о 10% переболевших за прошедший год. Т.е. наклон прямой должен быть равен не 1, а 0.9.
Но если посмотреть на наклоны прямых, то они настолько далеки как от 1, так и от 0.9, что упоминать об этом в публикации не имеет никакого смысла. Надо балансировать между сложностью и примитивизмом, не скатываясь ни в одну из крайностей.
x2v0
01.02.2022 09:48Для меня очевидно, что автор не прочитал ни одной научной статьи по теме, которую о освещает.
Я бы порекомендовал ему проштудировать подборку -
https://www.ncbi.nlm.nih.gov/research/coronavirus/docsum?filters=topics.Epidemic Forecasting
Но, в целом, мое личное мнение, могу ошибаться, модели описания эпидемии ковида, пока не сущществует - слишком много входных, а также скрытых параметров, поэтому "любая" модель может дать "любой" результат. Тоже касается эффективности вакцин.
PythonAnalyst Автор
01.02.2022 10:03Если вы видите ошибку, то, пожалуйста, укажите ее, и я внесу в публикацию исправления. Давать подборку с фразой "сам найди у себя ошибку" не корректно.
В публикации я не строил модель эпид. процесса. Статистика тем и хороша, что позволяет делать оценки характеристик систем, не анилизируя их внутреннее устройство (например, сравните молекулярную физику и термодинамику).
homesoft
01.02.2022 11:34Когда сравниваете разные года, не забывайте скоректировать на естественный прирост (или убыль) населения в каждой возрастной категории. Часто население "перезжает" из одной возрастной категории в другую между разными годами. Это тоже вносит неравномерности. Чем мельче разбивка по возрасту, тем точнее получится. Гистограмма по возрастам очень неравномерна, и она из года в год меняется очень сильно. И эти изменения выше порога того сигнала, который вы хотите найти.
PythonAnalyst Автор
01.02.2022 11:55Для России нет разбивки по возрастным группам, а для США приведены также общие показатели, которые демонстрируют туже зависимость.
kostushka
01.02.2022 13:26+2Давайте постараемся ничего не напутать: т.е. автор коррелировал избыточную смертность - превышение текущей смертности над средней за аналогичный период за прошлые годы, не обязательно от коронавируса (!), с долей невакцинированного населения ... что же могло пойти не так? Ну кроме того, что коррелируются вообще непонятно как связанные категории.
Почему проводя линейную аппроксимацию, автор ни слова не говорит о коэффициенте корреляции? Да просто потому что он околонулевой, полученные тренды носят случайный характер!
PythonAnalyst Автор
01.02.2022 13:35-1Спасибо за комментарий по существу публикации.
Я анализировал превышение текущей смертности не над средним за предыдущие периоды, а над прошлогодним. Действительно в рассмотрение также попадают смерти не только от коронавируса, но нет причин ожидать изменения их значений (иначе бы весь страховой бизнес был бы не состоятелен).
Я писал, что данные сильно зашумлены, поскольку на каждую точку (представляющую отдельный регион) влияет очень большое количество факторов, которые меняют ее значение. В этом случае коэффициент корреляции действительно малоэффективен (поскольку корреляция с доминирующим шумом будут близка к 0).
В подобном случае более разумно применить усреднение, которое я подробно описал в публикации. Этот смелый шаг (до которого мало кто может додуматься)- основной драйвер моего исследования.homesoft
01.02.2022 13:59+2но нет причин ожидать изменения их значений
Это очень и очень опрометчивое допущение. Изменилось поведение людей, причём очень сильно изменилось. Люди стали бояться идти к врачу на обследование (а вдруг корону подхватят). Запустились хронические заболевания. Это скажется на смертности. При этом люди стали чаще работать из дому (кому профессия позволяет) - соответственно меньше проишествий вне дома, но больше внутри дома. Возможно влияние на домашнее насилие (люди слетевшие с катушек из-за ограничений и прочих безумств). Смерти от побочных реакций препарата тоже вносят далеко ненулевой вклад (см. базы VAERS, EudraVigilance), иначе как объяснить рост общей нековидной смертности среди молодого населения в 2021, которой не наблюдалось в 2020.
На самом деле факторов, влияющих намного больше, чем мы в сотоянии учесть, поэтому и можем доказать практически любую гипотезу, в зависимости от того, что мы ищем. А в общем случае имеем шум и ничего кроме шума.
PythonAnalyst Автор
01.02.2022 14:08-1Опять про косточки от вишни...
Господи, как вернуть в адекватное состояние подобных людей?
homesoft
01.02.2022 14:12+2А по существу нечего ответить?
PythonAnalyst Автор
01.02.2022 14:27Как на иррациональное возражение можно ответить логически? Вот скажет какая- нибудь цыганка, что помахав руками залечила мне карму, и как я на это возражу? Буду пытаться доказывать, что карма до сих пор не залечена?
Другой вопрос, почему ваши возражения иррациональны? Потому что вас страшилками о Covid-19 ввели в стрессовое состояние, в котором засыпает разум и вслед за этим порождаются чудовища.
homesoft
01.02.2022 14:35+2Ну скажем так, ничего иррационального я не привёл. Модель на самом деле действительно сложнее, чем может на первый взгляд показаться, и факторов действительно много. Нельзя всё упрощать донельзя (но у исложнять тоже). А констатируемые корреляции - часто обманчивы, так как не установлена причинно-следственная связь (и таких примеров много, как классический пример корреляции между потреблением сыра и количеством убийств).
А вот фактического списка факторов, который нужно учитывать, у меня действительно нет. Но если хорошо порыться в научной литературе, можно и найти. У меня пока больше вопросов, чем ответов.
А насчёт страшилок и стресса - вы правы. И это обуславливает иррациональное поведение человечества в целом.
Вот, кстати, ещё "пища" для анализа. Достаточно детализированная. Было бы интересно проанализировать: https://www.ons.gov.uk/peoplepopulationandcommunity/birthsdeathsandmarriages/deaths/datasets/deathsbyvaccinationstatusengland
kostushka
01.02.2022 15:03-1А почему напрямую не коррелировать смерти по коронавирусной причине с долей невакцинированного населения?
Еще хотелось бы предостеречь от получения ложных корреляций, когда обе величины зависят (положительно скоррелированы с третьей), например даже если вакцина работает, на каком-то временном интервале будет расти и доля вакцинированных, и доля смертей, в результате можно сделать неверный вывод
Говорить об эффективности вакцины можно только после вакцинации достаточно большой доли населения, и соответственно только там проводить тренды
homesoft
01.02.2022 15:15+1Просто напрямую скорее всего нельзя.
Предположим, у нас есть 2 группы населения, вакцинированная и невакцинированная. Что мы о них знаем? Являются ли группы идентичными по риск-факторам? А именно, распределение по возрасту, по наличию сопутсвующих факторов, по социальному положению, по этническому составу, по наличию уже перенесенного ковида - всё это будет влиять на смертность. Если группы идентичные - мы можем их сравнивать. В противном случае есть риск получить bias в какой-то из групп и принять наблюдаемое за причинно-следственную связь.
Вопрос не так прост, как кажется...
PythonAnalyst Автор
02.02.2022 17:57В публикации я написал, что не доверяю информации, которую распространяет сайт стопкоронавирус (в том числе официальным данным о смертности непосредственно от Covid- 19). Их смертность от коронавируса примерно в 5 раз ниже избыточной смертности, что очевидно является обманом.
Вакцинация даже на низких уровнях дает свой эффект. Представьте, что R0=4, тогда 1 заболевший заразит 4 человек. Но если популяция вакцинированна на 25%, то он заразит уже 3-ех, а при 50% вакцинированных- всего 2-ух человек. Поэтому можно говорить об эффективности вакцинации на любом ее уровне.
rdp
01.02.2022 17:55Число получивших иммунитет естественным путём (т.е. переболевших) не учитывается совершенно, хотя оно постоянно растёт. Этим можно объяснить уменьшение доли невакцинированных во времени.
tvr
01.02.2022 19:55Бинго! Тем паче, что немалая доля переболевших вообще не учтена, никак, ибо они не обращались за мед. помощью.
PythonAnalyst Автор
01.02.2022 20:09В комментариях этот вопрос уже рассматривался: естественная иммунизация населения влияет только на изменение теоретического наклона прямой с 1 до 0.9. Оба эти значения далеки от полученных по реальным данным наклонам усредненной прямой. Т.е. с вашей поправкой усложнение есть, а результат получается точно такой же.
piratarusso
02.02.2022 10:20Спасибо за публикацию, Довольно любопытные данные. Оценить выводы проблематично.И виноват тут совсем не автор. Большую часть претензий следует адресовать гсоударственным органам, которые не публикуют достоверную статистику по смертности, количеству вывленных заражений (и, самое интресное, по количеству сделанных тестов!) так и по эфективности вакцин. Агрессивные комметарии совсем необоснованны.
PythonAnalyst Автор
02.02.2022 13:07Вы смелый человек, поскольку первый кто отважился написать положительный комментарий. Хотя если посмотреть на оценки статьи, то они поделились примерно пополам и поэтому в комментариях стоило ожидать примерно равного количества как отрицательных, так и положительных отзывов. Но меньшинство боится писать комментарии на "религиозные" темы (чтобы большинство не обнулило им карму) и вместо этого благодарности шлют в личку :)
piratarusso
03.02.2022 10:13Не знаю, насколько я смелый, мне просто на карму фиолетово. Что собственно от неё зависит? А рационально действующие люди кое-что в нашем мире всё-таки определяют. :)))
Vivo22
02.02.2022 20:38Я видимо не совсем в теме. Можете прояснить для меня два момента?
Кто такие "неполностью вакцинированные"? Соответственно, вакцинированные и полностью вакцинированные?
В начале рассматривали теоретический график избыточной смертности от доли непривитых. Получилась прямая из (0;0) в (1;1). Значения равные нулю и единице для избыточной смертности - это сколько? Или относительно чего? И что означает единица для избыточной смертности на рассчитанных графиках? Такое ощущение, что теоретическая единица и единица на графиках - не одно и то же.
PythonAnalyst Автор
03.02.2022 08:27Вакцинированные получили 1 укол, полностью вакцинированные- 2 укола, невакцинированные - 0 уколов, неполностью вакцинированные-0 или 1 укол.
Если вопрос стоит о том, сколько в абсолютном значении умерло человек при той или иной избыточной смертности, то для 0 это очевидно 0 (исходя из определения избыточной смертности), а для 1- столько же сколько в прошлом году (исходя все из того же определения). 1 означает повторение в 2021 году смертности 2020 года. Если вы считаете, что рассчитывая избыточную смертность я в коде допустил ошибку, то, пожалуйста, укажите ее (проект представлен на Github-е).
iperunin
03.02.2022 08:27Нет у вас никакого усреднения. Вы для данного значения доли складывате 1-5 точек, то есть точки аппроксимации сильно зависят от специфики нескольких регионов попавших в некоторую окрестность значения доли по невакцинированным.
Вот здесь, например, зависимость смертности от доли вакцинированных в Европе в ноябре. Слева - процент полностью вакцинированного ВЗРОСЛОГО НАСЕЛЕНИЯ (не всего!), справа - чисто летальных исходов на 1 млн населения (т.е. смертность) за последние 14 дней, когда наблюдается всплеск заболеваемости в ЕС. При доле меньше 70% смертность зависит исключительно от специфики страны (возьмите, например Латвию, Литву и Эстонию) и это те самые "усредненные данные по стране", видимость вы которых вы пытаетесь создать. Разброс значений может достигать 3-10 раз. А для отдельных областей внутри страны этот разброс еще больше, провести ваши прямые с учетом этого можно практически как угодно.
PythonAnalyst Автор
03.02.2022 08:42Нет у вас никакого усреднения. Вы для данного значения доли складывате
1-5 точек, то есть точки аппроксимации сильно зависят от специфики
нескольких регионов попавших в некоторую окрестность значения доли по
невакцинированным.А почему вы считаете, что прямая в определенной окрестности проходит в том или ином месте, только исходя из среднего значения в этой окрестности? На то она прямая, а не ломанная, чтобы одновременно при построении учитывались все точки.
Вот здесь, например, зависимость смертности от доли вакцинированных в Европе в ноябре.
Я брал информацию только из официальных источников для двух крупных стран и привел код на Github. Вы можете проверить выполненные расчеты.
p.s. Я вас понимаю: вы стоите на пороге пугающего шага. Ведь если все проверив вы признаете корректность моей работы, то следом необходимо признать и лживость гигантского массива информации, распространяемой официальными СМИ (в том числе через прикормленных экспертов и "независимые" группы в соц.сетях). Выбор между неудобной правдой и удобной ложью в свое время делает каждый. Пришел и ваш черед.
iperunin
03.02.2022 10:18Потому что это напрямую следует из заявленного вами алгоритма устранения якобы "белого шума". Сложение графиков же. Шумом является разброс значений у при данном значении х. Вот и получается, что при данном значении х, среднее значение у определяется лишь по нескольким точкам, а не по всей выборке. А это огромная погрешность. Но судя по вашему ответу, вы этот "белый шум" просто аппроксимировали, ничего не выделяя.
PythonAnalyst Автор
03.02.2022 10:40Пожалуйста, изучите метод наименьших квадратов, который используется при построении регрессионных прямых. Эта информация снимет ваш вопрос.
iperunin
03.02.2022 14:46То есть вы придумали какую-то зависимость, взяли данные, непонятно как с ней связанные, прогнали их через мкн, и раз не совпало, от решили что реальность неправильная. Ок.
grumbler66rus
03.02.2022 11:50Вы стали жертвой Парадокса Сипсона
Вы взяли неполную информацию, и построили расчёт так, как будто она была полная.
Грубые ошибки привели к ложному выводу.
PythonAnalyst Автор
03.02.2022 13:27Пожалуйста, укажите где конкретно мною была допущена ошибка (данные и код приведены в публикации), и я попрвалю публикацию так, чтобы она содержала только корректные выводы.
Заранее благодарю за сотрудничество.
netAn
03.02.2022 13:44+1Я выше уже писал - приведите статью в соответствие с рекомендацией ВОЗ по оценке эффективности вакцин.
Она неправильная вся, ошибка в изначальном подходе.
PythonAnalyst Автор
03.02.2022 14:09Зачем вы в чужой беседе приводите комментарий, который раньше уже высказывали? Это чистый троллинг: пока мне не ответишь, не дам ни с кем другим общаться.
netAn
03.02.2022 16:01+1Мой комментарий никак вам не мешает в других местах писать тексты.
Я делаю акцент на вашей ошибке, так как в пандемию не стоит распространять фейки о вакцинации. Ваша статья содержит методические ошибки, из-за чего создаётся ложное впечатление о низкой эффективности вакцинации.
Прошу обратить внимание, что в России и других странах действует закон, по которому могут быть применены санкции за распространение такой информации.
PythonAnalyst Автор
03.02.2022 16:25Про ошибку вы, к сожалению, ничего не пишите (если бы хоть что- то было, то вы бы уже давно разнесли мою статью в пух и прах). Единственное чем вы недовольны- выводом, в котором я показал более скромный эффект от вакцинации, чем вам обещали по ТВ.
netAn
03.02.2022 13:45Автор зачем-то бегает теперь по фейсбуку и пристает к людям с просьбой опубликовать эту работу.
Аргументирует это тем, что она заплюсованная.
PythonAnalyst Автор
03.02.2022 14:06Мне запрещено распространять свою публикацию в социальных сетях?
Port5
03.02.2022 14:35+1По большому счёту да - антиваксерство уже наделало больших бед, поэтому его пропаганда порицается.
PythonAnalyst Автор
03.02.2022 14:48Пардон, а где в публикации вы видите "антиваксерство"? В статье я как дважды говорю о положительном влиянии бустерной дозы, так и оцениваю ненулевым значением эффективность вакцинации.
Вред приносит "шапкозакидательство": мы разработали вакцину с эффективностью выше 96% и теперь можно не боятся болезни (по гриппу почему- то за десятилетия эффективность выше 60% не смогли поднять). А люди продолжают умирать практически в том же количестве. Вы понимаете, что людей убивает ложь о супер- эффективности вакцины?
Port5
03.02.2022 15:08Пардон, а где в публикации вы видите "антиваксерство"?
А вот это кто написал: "Вывод: эффективность вакцинации от Дельта- штамма в России и США лежит в интервале от 15% до 30%."? Этот "вывод" основан на бредовых предпосылках, но звучит он как "вакцины фактически не работают".
А люди продолжают умирать практически в том же количестве.
И вы ещё спрашиваете, где я вижу "антиваксерство"?
Вред приносит "шапкозакидательство"
Вред приносит и шапкозакидательство, и антиваксерство.
PythonAnalyst Автор
03.02.2022 15:19А люди продолжают умирать практически в том же количестве.
И вы ещё спрашиваете, где я вижу "антиваксерство"?
А что не так в этом утверждении?
Port5
03.02.2022 15:30Люди не "продолжают умирать практически в том же количестве". Удосужтесь проверить страны, которые довели вакцинацию до уровня 80+% (напр. Португалия) и сравнить их со странами, где вакцинация меньше 50% (напр., Россия или Украина).
PythonAnalyst Автор
03.02.2022 16:02В публикации я большую часть посвятил тому, что нельзя сравнивать смертность по периодам с разной стадией эпид. процесса. Для Москвы удачно подобранные периоды сравнения дадут отличие до 9 раз. Вы из 150 стран нашли парочку карликовых государств (чтобы максимум эпид. процесса был более концентрирован), где отыгрался этот эффект. Но забыли про страны, где нет подобной картины.
Например, выше приведен график для США где в декабре в группе 65+ первый укол получило более 95% популяции, а второй порядка 90% (+бустер порядка 50%). И мы видим смертность на уровне 0.85 относительно предыдущего года.
Port5
03.02.2022 16:29Например, выше приведен график для США где в декабре в группе 65+ первый укол получило более 95% популяции, а второй порядка 90% (+бустер порядка 50%).
А группа 65+ не контактирует с более молодой группой? В группе 65- минус никто не умирает, все переносят с лёгким насморком? CDC указывает на общий уровень двумя дозами в 64%, что, в общем-то, не так уж много.
https://covid.cdc.gov/covid-data-tracker/#vaccinations_vacc-people-onedose-pop-5yr
PythonAnalyst Автор
03.02.2022 16:09Балин, так это тролль, которого я выше решил игнорировать. Жаль, что сразу не заметил.
Повторяю: можете сколько угодно писать теории, не имеющие ни одной ссылки на научную литературу или практические данные. Я уже потратил на вас очень много времени и в дальнейшем буду вас игнорировать.
Port5
03.02.2022 16:38Эпидемиологические данные анализируются и моделируются как минимум с семидесятых годов. Понятие порога вакцинации (вакцина должна тормозить распространение быстрее, чем появляются новые заражённые) идёт с тех же времён. Я вам ниже пару ссылок подкинул, там как раз рассказывают каким должен быть уровень вакцинации для эффективного торможения распространения болезни. По большом счёту, вы сам можете взять тот же google scholar и сами поискать что-нибудь по тегам "vaccination herd immunity" (доступ к закрытым статьям можно получить через sci-hub) - статей валом. Но вам, я так понимаю, это все не интересно.
ПС Агитация за антиваксерство, умышленная или нет, вполне может повлечь за собой наказание.
iperunin
03.02.2022 15:15+1Вам уже объясняли, что при уровне вакцинации менее 70% корона спокойно распространяется и жрет непривитых. А зависимость смертности от доли вакцинированных при этом является полной галиматьей, потому что влияет куча локальных факторов. Сами выдумали какие-то зависимости и определения, а теперь заявляете что весь мир "неправильный ".
PythonAnalyst Автор
03.02.2022 15:52А я в свою очередь осуществил вывод формулы распрострения заболевания в условиях вакцинации, которая СОВПАЛА с теоретическим графиком, приведенным моим оппонентом. Разжевал все до простеньких примеров, чтобы всем стала понятна несостоятельность идеи "барьера" вакцинации.
Вы можете дать хоть одну ссылку на научные публикации, где бы вводилось понятие "барьера" вакциации, до достижения которого вакцинация не действует?
Зачем вы отлично понимая о лживости тезиса его высказываете? Вы выбрали свою сторону, и я уже написал, что уважаю ваш выбор.
Port5
03.02.2022 16:23Разжевал все до простеньких примеров, чтобы всем стала понятна несостоятельность идеи "барьера" вакцинации.
Вы осознаёте, что "опровергаете" десятилетия исследований задолго до ковида?
Вы можете дать хоть одну ссылку на научные публикации, где бы вводилось понятие "барьера" вакциации, до достижения которого вакцинация не действует?
Пожалуйте хотя бы из ссылок из странички википедии, которую я вам приводил выше (а дальше, как говорится, ...and references therein):
https://pubmed.ncbi.nlm.nih.gov/21427399/
iperunin
03.02.2022 17:17+1О каком барьере вакцинации я вам говорил, я вам привел данные по странам, где ниже 70% начинается полный разброд по смертности, который можно объяснить лишь сильным влиянием локальных факторов. Вы же предлагаете модель, которая никак не подтверждается практикой, и ещё заявляете что я лгу. Если в статистике по европейским странам никакого намека нет на заявленную вами прямую, то какого вы хотите найти в статистике по российским регионам. Там разброд значений на порядки будет от заявленной вами зависимости, и никакой равномерной зашумленности, но вы конечно это все "устранили" с помощью МНК.
YourMama
Простите, а на каком графике можно посмотреть смертность среди только привитых?
И где Вы брали данные по смертности среди привитых, по Вашим ссылкам сходу не получилось найти?
AndreiChernykh1991
такую статистику мы точно никогда не увидим
YourMama
Такая статистика, конечно же, есть и её завались (школар в помощь: ["sputnik-v effectiveness" : 2,890 results]):
https://www.nejm.org/doi/full/10.1056/NEJMoa2117128
https://www.nejm.org/doi/full/10.1056/NEJMoa2115481
а то, что в этой статье сравнивается общая смертность с неизвестным количеством в ней вакцинированных против общей допандемийной смертности вообще никак не может быть основанием для такого заявления, какой вынесен в заголовок: возможно вакцинированные люди(например) вообще не умирают, а данные свидетельствуют только о том, что вакцинация идёт медленнее, чем распространяется вирус, из представленных данных этого НЕ ВИДНО.
oq0po
А среди сначала переболевших, а потом еще привитых?