20 мая в блоге Google появился отчет о новом проекте компании, направленном на борьбу с онкологическими заболеваниями. Созданная на основе технологий глубокого обучения модель обнаруживает раковые клетки на томограммах легких с точностью, недоступной человеческому глазу.

По данным Всемирной организации здравоохранения, рак легких – самое смертоносное из всех онкологических заболеваний, которое занимает шестое место в списке наиболее распространенных причин смерти. Ежегодно по всему миру умирает в среднем 1,7 млн человек с этим диагнозом – для сравнения, рак груди, рак кишечника и рак простаты в общей сложности уносят меньше жизней.

Болезнь значительно лучше поддается лечению на ранних стадиях, поэтому врачи уже несколько десятилетий говорят о важности профилактики и необходимости развивать методологию выявления злокачественных новообразований. Для диагностики рака сейчас применяется компьютерная томография: рентгеновский аппарат производит сканирование нужных органов и строит на базе полученных данных томограмму, которую изучает на предмет отклонений врач-рентгенолог. За каждый сеанс ему приходится просматривать сотни снимков, так что риск ошибок и упущений из-за человеческого фактора очень велик, особенно для случаев, когда раковые клетки еще немногочисленны.

Целью данного проекта компании Google было создание модели искусственного интеллекта, способной с высокой точностью рассчитывать вероятность развития болезни. Предполагалось, что модель будет выявлять мельчайшие новообразования (легочные узлы) в грудной клетке пациента и сопоставлять данные с результатами предшествующих сеансов, если таковые имеются, чтобы составить прогноз с визуализацией в 3D.



Схема работы модели

В работе применялись технологии глубокого обучения. В качестве начальной выборки исследователи использовали 45 856 наборов данных из базы Национальных институтов здравоохранения США с результатами сеансов томографии грудной клетки. Далее работа модели была протестирована на двух валидационных выборках объемом в 6716 и 1139 наборов соответственно. Показатель точности распознавания пациентов из группы риска составил 94,4%.

Чтобы лучше оценить эффективность разработки, на том же материале параллельно проводилось исследование традиционными методами – сертифицированные радиологи осматривали снимки без применения вспомогательных средств. Когда результаты сопоставили, выяснилось, что модель значительно точнее выявляет подозрительные новообразования в тех случаях, когда пациент проходит процедуру впервые, допуская на 11% меньше ошибок первого рода (false positives) и на 5% меньше ошибок второго рода (false negatives). При наличии же дополнительной информации из предыдущих томограмм искусственный интеллект и человеческий разум прогнозировали зарождение болезни примерно с равным успехом.

Google рассчитывает доработать модель в процессе активного практического тестирования. В данный момент компания ведет переговоры о сотрудничестве с многочисленными медицинскими учреждениями, а в скором времени разработка станет доступна в Cloud Healthcare API.

Комментарии (3)


  1. thauquoo
    22.05.2019 22:25

    Как человек, считающий, что Google превратился в корпорацию Зла, я теперь озадачен.

    Скажем так, если мне предложат — соглашусь ли я иметь аккаунт Google и разрешу ли собирать статистику по моей истории сёрфинга взамен на передовые диагностики рака? Пожалуй, оно того стоит.

    Я растерян.


    1. A1054
      23.05.2019 20:34

      Ээээ, вроде ведь вопрос так не стоит


  1. A1054
    23.05.2019 20:34

    допуская на 11% меньше ошибок первого рода (false positives) и на 5% меньше ошибок второго рода (false negatives).

    Если учесть, что точность распознавания 94.4% (что это такое, кстати?), то, скажем на 10% меньше ошибок, это значит, что точность распознавания выросла с ~ 94% до 94.4%. Точно не считаю, т.к. не совсем понимаю, что такое «точность распознавания».
    Я бы сказал, что это чуть точнее, но никак не «значительно точнее».
    Или я что-то не понял?