- Результаты исследований и испытаний – это не события. Существует метод диагностики рака, а есть само событие — наличие заболевания. Алгоритм проверяет, содержит ли письмо спам, но событие (на почту действительно пришел спам) нужно рассматривать отдельно от результата его работы.
- В результатах испытаний бывают ошибки. Часто наши методы исследований выявляют то, чего нет (ложноположительный результат), и не выявляют то, что есть (ложноотрицательный результат).
- С помощью испытаний мы получаем вероятности определенного исхода. Мы слишком часто рассматриваем результаты испытания сами по себе и не учитываем ошибки метода.
- Ложноположительные результаты искажают картину. Предположим, что вы пытаетесь выявить какой-то очень редкий феномен (1 случай на 1000000). Даже если ваш метод точен, вероятнее всего, его положительный результат будет на самом деле ложноположительным.
- Работать удобнее с натуральными числами. Лучше сказать: 100 из 10000, а не 1%. При таком подходе будет меньше ошибок, особенно при умножении. Допустим, нам нужно дальше работать с этим 1%. Рассуждения в процентах неуклюжи: «в 80% случаев из 1% получили положительный исход». Гораздо легче информация воспринимается так: «в 80 случаях из 100 наблюдали положительный исход».
- Даже в науке любой факт — это всего лишь результат применения какого-либо метода. С философской точки зрения научный эксперимент – это всего лишь испытание с вероятной ошибкой. Есть метод, выявляющий химическое вещество или какой-нибудь феномен, и есть само событие — присутствие этого феномена. Наши методы испытаний могут дать ложный результат, а любое оборудование обладает присущей ему ошибкой.
Tеорема Байеса превращает результаты испытаний в вероятность событий.
- Если нам известна вероятность события и вероятность ложноположительных и ложноотрицательных результатов, мы можем исправить ошибки измерений.
- Теорема соотносит вероятность события с вероятностью определенного исхода. Мы можем соотнести Pr(A|X): вероятность события А, если дан исход X, и Pr(X|A): вероятность исхода X, если дано событие А.
Разберемся в методе
В статье, на которую дана ссылка в начале этого эссе, разбирается метод диагностики (маммограмма), выявляющий рак груди. Рассмотрим этот метод подробно.
- 1% всех женщин болеют раком груди (и, соответственно, 99% не болеют)
- 80% маммограмм выявляют заболевание, когда оно действительно есть (и, соответственно, 20% не выявляют)
- 9,6% исследований выявляют рак, когда его нет (и, соответственно, 90,4% верно определяют отрицательный результат)
Теперь оформим такую таблицу:
|
Болеют (1%) | Не болеют (99%) |
Положительный результат метода |
80% | 9,6% |
Отрицательный результат метода |
20% |
90,4% |
Как работать с этим данными?
- 1% женщин болеют раком груди
- если у пациентки выявили заболевание, смотрим в первую колонку: есть 80% вероятность того, что метод дал верный результат, и 20% вероятность того, что результат исследования неправильный (ложноотрицательный)
- если у пациентки заболевание не выявили, смотрим на вторую колонку. С вероятностью 9,6% можно сказать, что положительный результат исследования неверен, и с 90,4% вероятностью можно сказать, что пациентка действительно здорова.
Насколько метод точен?
Теперь разберем положительный результат теста. Какова вероятность того, что человек действительно болен: 80%, 90%, 1%?
Давайте подумаем:
- Есть положительный результат. Разберем все возможные исходы: полученный результат может быть как истинным положительным, так и ложноположительным.
- Вероятность истинного положительного результата равна: вероятность заболеть, умноженная на вероятность того, что тест действительно выявил заболевание. 1% * 80% = .008
- Вероятность ложноположительного результата равна: вероятность того, что заболевания нет, умноженная на вероятность того, что метод выявил заболевание неверно. 99% * 9.6% = .09504
Теперь таблица выглядит так:
Болеют (1%) | Не болеют (99%) | |
Положительный результат метода |
Истинный положительный: 1% * 80% = .008 |
Ложноположительный: 99% * 9.6% = .09504 |
Отрицательный результат метода |
Ложноотрицательный: 1% * 20% = .002 |
Истинный отрицательный: 99% * 90,4% = .89496 |
Какова вероятность, что человек действительно болен, если получен положительный результат маммограммы? Вероятность события — это отношение количества возможных исходов события к общему количеству всех возможных исходов.
вероятность события = исходы события / все возможные исходы
Вероятность истинного положительного результата – .008. Вероятность положительного результата — это вероятность истинного положительного исхода + вероятность ложноположительного.
(.008 + 0.09504 = .10304)
Итак, вероятность заболевания при положительном результате исследования рассчитывается так: .008/.10304 = 0.0776. Эта величина составляет около 7.8%.
То есть положительный результат маммограммы значит только то, что вероятность наличия заболевания – 7,8%, а не 80% (последняя величина — это лишь предполагаемая точность метода). Такой результат кажется поначалу непонятным и странным, но нужно учесть: метод дает ложноположительный результат в 9,6% случаев (а это довольно много), поэтому в выборке будет много ложноположительных результатов. Для редкого заболевания большинство положительных результатов будут ложноположительными.
Давайте пробежимся глазами по таблице и попробуем интуитивно ухватить смысл теоремы. Если у нас есть 100 человек, только у одного из них есть заболевание (1%). У этого человека с 80% вероятностью метод даст положительный результат. Из оставшихся 99% у 10% будут положительные результаты, что дает нам, грубо говоря, 10 ложноположительных исходов из 100. Если мы рассмотрим все положительные результаты, то только 1 из 11 будет верным. Таким образом, если получен положительный результат, вероятность заболевания составляет 1/11.
Выше мы посчитали, что эта вероятность равна 7,8%, т.е. число на самом деле ближе к 1/13, однако здесь с помощью простого рассуждения нам удалось найти приблизительную оценку без калькулятора.
Теорема Байеса
Теперь опишем ход наших мыслей формулой, которая и называется теоремой Байеса. Эта теорема позволяет исправить результаты исследования в соответствии с искажением, которое вносят ложноположительные результаты:
- Pr(A|X) = вероятность заболевания (А) при положительном результате (X). Это как раз то, что мы хотим знать: какова вероятность события в случае положительного исхода. В нашем примере она равна 7,8%.
- Pr(X|A) = вероятность положительного результата (X) в случае, когда больной действительно болен (А). В нашем случае это величина истинных положительных – 80%
- Pr(A) = вероятность заболеть (1%)
- Pr(not A) = вероятность не заболеть (99%)
- Pr(X|not A) = вероятность положительного исхода исследования в случае, если заболевания нет. Это величина ложноположительных – 9,6 %.
Можно сделать заключение: чтобы получить вероятность события, нужно вероятность истинного положительного исхода разделить на вероятность всех положительных исходов. Теперь мы можем упростить уравнение:
Pr(X) – это константа нормализации. Она сослужила нам хорошую службу: без нее положительный исход испытаний дал бы нам 80% вероятность события.
Pr(X) – это вероятность любого положительного результата, будет ли это настоящий положительный результат при исследовании больных (1%) или ложноположительный при исследовании здоровых людей (99%).
В нашем примере Pr(X) – довольно большое число, потому что велика вероятность ложноположительных результатов.
Pr(X) создает результат 7,8%, который на первый взгляд кажется противоречащим здравому смыслу.
Смысл теоремы
Мы проводим испытания, чтоб выяснить истинное положение вещей. Если наши испытания совершенны и точны, тогда вероятности испытаний и вероятности событий совпадут. Все положительные результаты будут действительно положительными, а отрицательные — отрицательными. Но мы живем в реальном мире. И в нашем мире испытания дают неверные результаты. Теорема Байеса учитывает искаженные результаты, исправляет ошибки, воссоздает генеральную совокупность и находит вероятность истинного положительного результата.
Спам-фильтр
Теорема Байеса удачно применяется в спам-фильтрах.
У нас есть:
- событие А — в письме спам
- результат испытания — содержание в письме определенных слов:
Фильтр берет в расчет результаты испытаний (содержание в письме определенных слов) и предсказывает, содержит ли письмо спам. Всем понятно, что, например, слово «виагра» чаще встречается в спаме, чем в обычных письмах.
Фильтр спама на основе черного списка обладает недостатками — он часто выдает ложноположительные результаты.
Спам-фильтр на основе теоремы Байеса использует взвешенный и разумный подход: он работает с вероятностями. Когда мы анализируем слова в письме, мы можем рассчитать вероятность того, что письмо — это спам, а не принимать решения по типу «да/нет». Если вероятность того, что письмо содержит спам, равна 99%, то письмо и вправду является таковым.
Со временем фильтр тренируется на все большей выборке и обновляет вероятности. Так, продвинутые фильтры, созданные на основе теоремы Байеса, проверяют множество слов подряд и используют их в качестве данных.
Дополнительные источники:
Комментарии (13)
turchin
01.12.2017 14:11+1Простое объяснение в двух строках: представьте что вы встретили в портовом городе человека в очках: что более вероятно, что он библиотекарь или что он моряк?
Правильный ответ, что моряк, так как моряков гораздо больше в городе, и малая доля их, носящая очки, перевешивает большую долю библиотекарей.
Gryphon88
01.12.2017 17:43Как всегда, главная проблема с исходными данными. В медицине они обычно определяются по диагностической операции или на вскрытии, очень сложно вести проспективное исследование.
DjSens
01.12.2017 18:24Я уже много лет назад интуитивно это понял, с тех пор никому и ничему не верю на 100%, даже себе. Оперирую только вероятностями — от 1% до 99%
Sigthror
02.12.2017 11:25Коль память меня не подводит, я встречал похожие выводы в книге Талеба Нассима «Одураченный случайностью», при этом он этот вопрос (по его словам) задавал практикующим врачам.
T0tem
02.12.2017 11:25Текст последней ссылки, только в переводе.
schegl2g.bget.ru/bayes/YudkowskyBayes.html
northzen
02.12.2017 11:31У меня есть простое геометрическое объяснение теоремы Байеса, но эти объяснений сейчас тонны. И каждое из них не дает интуитивного объяснения, формула выглядит как магия, в которую надо правильно подставлять величины.
Кому-нибудь будет интересно на пальцах это показать с картинками?
Kirill80
02.12.2017 11:31Для байсовских методов нет «простых объяснений». Нету их. Байсовский метод это сложно. Сложно. И крайне затратно и организационно, и вычислительно. Но, в результате, чаще всего — эффективно.
P. S.: Не парьтесь, нужно это, в действительности, нескольким тысячам человек на планете. Да, скорее всего, вы в это число не входите. И не войдёте никогда. Стоит ли из-за это переживать? Нет, не стоит.
Daddy_Cool
02.12.2017 12:01Любопытно. Я читал, что программы ранней диагностики РМЖ особо не повлияли на продолжительность жизни заболевших. Значит ли это, что 80% — слишком низкая точность и на самом деле нет смысла заморачиваться ранней диагностикой на уровне страны?
С другой стороны — если есть положительный результат, то дальше можно делать биопсию, и т.п…Ryppka
03.12.2017 14:59Тут, как всегда, два аспекта: а)это действительно не сильно эффективно, т.к. даже «раннее обнаружение» влияет на исход не так сильно, как хотелось бы и б)даже если эффективность невелика, отказ от такой программы сильно смахивает на неоказание помощи. Нужен баланс желаемого и возможного.
EvilArcher
Похвально, что автор проделал данный труд по написанию статьи. Вот, только она получилась не намного короче, чем у Юдковского.
Лично для себя, я интерпретирую теорему Байеса очень просто:
получая какую-либо новую информацию об окружающем мире, следует корректировать свои убеждения, ибо, если не делать этого, то ваши убеждения не более, чем слепая вера.
seminole
Это не Байес, это Кант. Sapere aude