Летальность — это вероятность умереть, если у пациента диагностирована болезнь. Вот цитата из научной статьи:
one of the most important epidemiologic quantities to be determined is the case fatality ratio—the proportion of cases who eventually die from the disease.
Смертность — это отношение числа умерших от болезни к размеру популяции за какой-то промежуток времени. Обычно, считают сколько смертей на 100 тыс. населения за единицу времени. Смертность непосредственно связана с летальностью: это произведение вероятности заболеть (за определенный временной период) на летальность. В самом деле, для того, чтобы умереть от болезни надо сначала ей заразиться, а потом уж, если не повезет…
Высокая летальность не означает автоматически, что смертность тоже высокая. Например, болезнь убивает с вероятностью 1, но поражает всего 0.1% населения, скажем, за год (похожим образом ведет себя вирус Эболы, к примеру). Тогда смертность составит всего 1/1000. В то время как болезнь с летальностью в сто раз меньше (0.01) может иметь в 10 раз более высокую смертность (1/100), если поражает все население за тот же период.
Смертность явно зависит от времени — со временем количество инфицированных, как правило, увеличивается, поэтому и смертность растет. Летальность же от времени не зависит явным образом, но, например, может снизиться со временем, если найдут/изобретут лекарство.
Можно еще сказать, что летальность это условная вероятность смерти при условии болезни, а смертность — это вероятность умереть от болезни за какой-то временной промежуток.
Летальность, в свою очередь, подразделяется на Case Fatality Ratio (CFR) и Infection Fatality Ratio (IFR):
CFR — это летальность, рассчитанная по подтвержденным случаям. У этого показателя есть подводный камень: в первую очередь обычно тестируют тех, у кого ярко выражены симптомы. Поэтому можно сказать, что в первом приближении CFR — это вероятность смерти при условии наличия болезни и выраженных симптомов.
IFR — это и есть летальность, то есть вероятность смерти при наличии болезни. Этот показатель включает также легкие и бессимптомные случаи болезни и поэтому может быть намного меньше чем CFR. Точно рассчитать этот показатель практически невозможно, потому что мало кто станет тестировать все население, чтобы учесть и бессимптомных носителей тоже, но его можно оценить.
В эпидемиологии крайне важно уметь в начале эпидемии оценить летальность, чтобы иметь возможность принять меры, сообразные тяжести заболевания. К сожалению, сделать это чрезвычайно сложно и сейчас мы узнаем почему.
Одним из наиболее популярных методов оценки летальности является простая формула: Deaths / Cases, то есть количество смертей от болезни поделить на общее число инфицированных к текущему моменту. К сожалению, эта весьма популярная оценка (называемая также наивным методом) обладает врожденным недостатком, который иллюстрируется следующим примером:
Пусть некая болезнь убивает ровно за 1 месяц с вероятностью 1. Пусть также количество заболевших удваивается каждые 10 дней. Допустим, в первый месяц умерло х человек. Но заболевших, которые еще не умерли, в 7 раз больше! Просто потому, что за месяц произойдет три удвоения исходной популяции больных (а это увеличение в 8 раз). Поэтому метод, когда делят количество умерших на количество диагностированных оценит летальность всего лишь в %!
Эта недооценка наивного метода приводит к ложным спекуляциям. Например, во время эпидемии SARS наивная оценка росла со временем, порождая слухи о том, что вирус эволюционирует, превращаясь в более смертоносного убийцу. А причиной этого является простая математика: рост количества заболевших замедляется, что уменьшает недооценку летальности наивным эстиматором.
Таким образом, можно сказать, что наивный метод недооценивает летальность, уменьшая ее в раз, где — это время от заражения до смерти, а b — параметр, характеризующий время удвоения количества зараженных. Но, к сожалению, такая поправка плохо работает в реальной жизни, потому что пациенты умирают не строго через определенный промежуток времени организованными группами, а случайным образом. Давайте учтем это и выведем формулу поправки, которая будет применима в реальной жизни.
А теперь давайте посчитаем сколько же человек из заболевших в первый день умрет ко дню n:
Теперь посчитаем количество смертей для заболевших в другие дни (до дня n включительно) и сложим их:
Где (это следует из того, что количество кейсов растет по экспоненте). С учетом всего вышенаписанного:
Отсюда можно выразить bias-corrected летальность:
Таким образом, наивный эстиматор занижает реальную летальность в раз.
А теперь попробуем оценить этот bias для оценки летальности в ранний период развития эпидемии коронавирусной инфекции в китайском городе Ухань. Для этого воспользуемся следующими предположениями: время удвоения числа заболевших равно 5 дням, а среднее время от регистрации до смерти равно 18 дням.
Но нам нужно среднее время не от появления симптомов, а от регистрации до смерти. Здесь было показано, что медианной время от появления симптомов до регистрации равняется 4.25 дням. Значит, среднее время от регистрации до смерти примерно равно 18 дням.
Еще предположим, что день смерти имеет распределение Пуассона:
Подставив значения в формулу, получим, что наивный метод занижает летальность примерно в 9 раз. Таким образом, CFR по подтвержденным случаям составляет около 18%! Подчеркиваю, что CFR не включает недокументированных пациентов, количество которых оценили китайские ученые: по их модели, 86% случаев были не зарегистрированы. Это позволяет нам вычислить IFR: IFR = 0.14*CFR = 2.5%. Эти оценки прекрасно согласуются с оценками CFR (18%, 11%-81%), и IFR (1%, 0.5%-4%), которые были получены специалистами Imperial College London.
Важно понимать, что значение IFR не следует использовать для оценки вероятности умереть от болезни, так как вероятность умереть от болезни зависит от множества факторов:
- возраста
- наличия сопутствующих заболеваний
- загруженности больниц
- вирусной нагрузки
- и т. д.
Тогда для чего же так важно знать IFR хотя бы приблизительно? Это нужно знать для того, чтобы иметь возможность сравнить с известными заболеваниями. Например, летальность (IFR) гриппа составляет 0.01%, что, как минимум, в десятки раз ниже. С учетом того, факта, что коронавирус более заразный (R0 > 2 против примерно 1.3 у гриппа), это может привести к десяткам миллионов смертей по всему миру, так как грипп может уносить до 650 000 жизней в год. Поэтому ни в коем случае не стоит считать, что «это просто грипп».
Данная статья имеет следующие цели: объяснить в чем различие между смертность и летальностью, объяснить, что такое CFR и IFR (чтобы люди не искали разницу между Италией и другими странами в уровне медицины), объяснить, что нельзя полагаться на оценки, полученные методом Deaths/Cases, а для любителей математики вроде меня еще и разобраться как этот метод можно исправить.
MooNDeaR
Это не согласуется с реальными цифрами в Китае, в котором на данный момент насколько я ознакомился с последними новостями, новых зараженных не появляется.
На данный момент цифры такие (из карты яндекса):
Число выздоровевших: 73 278
Число смертей: 3 281
Заражений: 81 588
Еще есть некоторое количество людей, которые не выздоровели их судьба пока неизвестна, но возьмем за аксиому, что они никого не заразят и доля смертей будет такой же как и сейчас. Тогда посчитаем только тех, чья судьба уже решилась:
CFR = 3281 / (3281 + 73 278) = ~4,3 %.
Тогда, если взять модель в 86% не диагностированных случаев, то IFR должен быть в районе 0,5%.
afedintsev Автор
В Китае изменили тактику тестирования и начали шире тестировать при помощи компьютерной томографии. У КТ чувствительность больше, что позволило выявить больше бессимптомных, но при этом есть и ложноположительные результаты, поэтому я не опираюсь на последние данные по Китаю.
MooNDeaR
Я могу согласиться с тем, что IFR по китаю особо не посчитать, но нам и не нужно. Основная цифра, которая меня интересует: если я попал в больницу или получил диагноз, какие у меня шансы оттуда выйти.
Судя по вашим оценкам — умрёт каждый пятый (ну, почти).
Судя по реальным цифрам, умрет каждый двадцать пятый. Это всё еще дохрена, но не настолько пессимистично.
Про статистику ложноположительных диагнозов (того, что влияет на CFR) ничего в статье не сказано.
afedintsev Автор
— эти «реальные» цифры уже ближе к IFR чем к CFR, так как компьютерная томография обладает большей чувствительностью (а это значит, что большее количество бессимптомных будет попадать в статистику), а также меньшей специфичностью (что означает занижение летальности из-за ошибочной диагностики пневмоний, вызванных, например, гриппом). 75% результатов КТ — ложноположительные pubs.rsna.org/doi/10.1148/radiol.2020200642
MooNDeaR
Прошел по вашей ссылке.
75% не ложноположительных, а 75% среди тех, на ком RT-PCR выдал негативный результат. Т.е. из общей массы (1014 человек) ложно-положительный получили только 30%. Причем только 48% из них (150 человек, или же 15% от всех) не были бы отправлены на дополнительное тестирование через RT-PCR, потому что получили оценку "highly likely", остальных бы точно отправили на доопследование.
В итоге получается, что КТ даёт примерно 15% ложноположительных больных, т.е. знаменатель в формуле CFR надо домножить на 0,85 (убрав тем самым из общего числа больных ребят, случайно попавших в выборку будучи здоровыми).
CFR = 3281 / ( 0.85 * (3281 + 73 278) ) =~ 5.0%.
Всё еще даже близко не 18%.
afedintsev Автор
Ок, не 75% ложноположительных. Но вы же пишете:
А это значит что? Что КТ позволяет задетектить больше пациентов и поэтому количество подтвержденных кейсов тоже будет больше, что смещает оценку в сторону IFR, а не CFR. 18% же получены только на тех, кому делали RT-PCR, поэтому и сравнивать их некорректно
MooNDeaR
Ну, я все ещё считаю, что этот сдвиг должен быть не такой значительный. КТ делают уже при наличии симптомов. Не всем же подряд его прописывают. В общем, вернёмся к разговору через месяц, да посмотрим на цифры)
afedintsev Автор
Посмотрите на Южную Корею — там тестировали максимально широко(6148 тестов на миллион человек). Сейчас там 120 умерших и 3507 выздоровевших, что дает консервативный эстимейт IFR в 3.3%.
wsgy04
А можно источник на чувствительность кт? В моем понимании кт возможно покажет очаги затемнения в легких до развития клинических признаков тяжелого осложнения в виде пневмонии. Но делать его просто так всем бессимптомным? Мб все таки пациентам с легким (пока еще течением)?
afedintsev Автор
pubs.rsna.org/doi/10.1148/radiol.2020200642
А вот тут показано, что у бессимптомных пациентов КТ видит изменения в легких: pubs.rsna.org/doi/10.1148/ryct.2020200110
Возможно, что бессимптомных там и не стали больше выявлять, но количество недокументированных кейсов явно значительно поубавилось.
kvas
> CFR = 3281 / (3281 + 73 278) = ~4,3 %.
Совершенно верно. Автор построил отличную мат модель, но забыл что надо ещё проверить применима ли она к реальной жизни. Модель, которая предполагает удвоение случаев каждые 5 дней к Китаю сегодня неприменима.
afedintsev Автор
да нет, автор ничего не забыл. Я видел эти 4% до написания статьи, вот только оценка недокументированных случаев (86%) не применима к более поздним данным, когда начали выявлять много новых случаев. На графике новых случаев в Китае хорошо виден резкий скачок — это как раз начали тестировать не только по ПЦР. Больше выявленных больных означает шире покрытие и меньшее количество недокументированных случаев. Нам просто не на что опереться (в плане количества недокументированных случаев), если будем использовать в качестве CFR те числа, которые вы приводите.
kvas
> вот только оценка недокументированных случаев (86%) не применима к более поздним данным, когда начали выявлять много новых случаев.
Ну ок, не применима. То есть мы не знаем как посчитать IFR от CFR = 4%. Но это же не значит что можно эту цифру выкинуть и делать вид что CFR всё ещё 18%.
> На графике новых случаев в Китае хорошо виден резкий скачок — это как раз начали тестировать не только по ПЦР
Он не очень большой, там всего где-то 10к случаев добавилось по сравнению с обычной скоростью роста в тот момент. То есть это точно не близко к 85% и после скачка всё равно скорее всего много непосчитанных случаев. Согласен что мы не знаем точно сколько, но это можно оценить и всё равно сегодняшние цифры мне кажутся более информативными.
afedintsev Автор
Вы неправильно поняли посыл моей статьи — CFR, по большому счету, бесполезная величина, так как сильно зависит от стратегии тестирования. Тестируем только тех, кого надо госпитализировать? Получаем CFR > 40% как в Италии! Но вирус везде один и тот же, летальность от него сильно не отличается поскольку нет специфического лечения. Поэтому имеет смысл только один показатель — IFR. Его я и оценил в 2.5%, что плюс-минус попадает в доверительные интервалы других оценок. Я привел в пример работу специалистов из Imperial College London, но помимо них есть еще Южная Корея, где проводят очень много тестов, а еще есть Diamond Princess: IFR = 1.8%, 95% CI: 0.8%-2.9%. Видно, что доверительный интервал включает оценку IFR моим методом. Но посыл поста вообще был не в оценках и прогнозах.
kvas
IFR тоже не один у всех, он зависит от возрастной структуры населения, состояния и загрузки медицинской системы, и ещё бог знает от чего. По оценкам, которые я видел, получается что-т типа 0.5% если хватает аппаратов ИВЛ и прочей интенсивной терапии на все тяжёлые случаи и 2.5% если не хватает. В Италии чуть больше, так как там более старое население. В любом случае это выглядит гораздо хуже чем грипп, тут я с вами согласен.
> Но посыл поста вообще был не в оценках и прогнозах.
Ну ок, а в чём он тогда был?
afedintsev Автор
afedintsev Автор
Объяснить в чем различие между смертность и летальностью, объяснить, что такое CFR и IFR (чтобы люди не искали разницу между Италией и другими странами в уровне медицины), объяснить, что нельзя полагаться на оценки, полученные методом Deaths/Cases, а для любителей математики вроде меня еще и разобраться как этот метод можно пофиксить.
kvas
О, кстати, есть вот ещё какая штука: если мы знаем IFR в какой-то стране, то зная количество смертей можно попробовать оценить общее количество случаев. Понятно что если это делать наивно, то мы получим сколько было случаев две недели назад, но это можно откорректировать. Общее число случаев и его динамика — это весьма полезные метрики, которые позволяют оценить личный уровень риска, понять насколько работают существующие меры и нужно ли добавить или убавить мер.
Вы наверняка это и так знаете, но в посте не написали, а это по-моему важный момент.
afedintsev Автор
kvas
Отлично, но ваш калькулятор полагается на то, что число случаев в среднем удваивается за 5 дней. Это верно только если никаких мер не принимать, то есть в данный момент в большинстве стран калькулятор неприменим.
Я имел ввиду, что если мы знаем IFR и знаем сколько смертей в день сейчас происходит, то можно прикинуть сколько заражалось в день две недели назад (или сколько там в среднем получится), а от этого, зная скорость умножения инфекции в эти последние две недели (можно прикинуть по динамике официальных случаев и смертности) можно прикинуть сколько новых заражённых сегодня. Во всех этих числах есть неточности конечно, но порядок хотя бы можно оценить.
afedintsev Автор
В начале эпидемии удвоение еще быстрее идет