Использование искусственного интеллекта в различных областях деятельности человека становится все более обыденным делом. Хоть ИИ и далек от многогранности человеческого мозга, в некоторых ситуациях он все же весьма полезен. Особенно если речь идет об анализе данных. Ученые из медицинского факультета Вашингтонского университета (США) разработали алгоритм машинного обучения, способный быстро и точно прогнозировать потенциальный риск метастазирования мозга по данным биопсии пациентов с немелкоклеточным раком легких на ранней стадии. Как именно работает данный алгоритм, и насколько он эффективен? Ответы на эти вопросы мы найдем в докладе ученых.

Основа исследования


Немелкоклеточный рак легких (NSCLC от non-small cell lung cancer) остается лидирующей причиной смертности от рака во всем мире. Несмотря на весьма успешное лечение хирургическим путем, почти в трети случаев на ранней стадии (стадии I–III) возникают рецидивы с отдаленными метастазами. Значительные достижения разработке терапевтических методов борьбы с NSCLC улучшили статистику выживаемости пациентов. Однако врожденная и приобретенная резистентность к терапии и прогрессирование заболевания в отдаленные метастазы остаются одной из самых распространенных причин заболеваемости.

Более глубокое понимание биологии опухолей позволяет предположить, что микроокружение опухоли первичного NSCLC может диктовать будущее метастатическое поведение. Метастазы в головной мозг, в частности, являются частой причиной заболеваемости и смертности при NSCLC. Стадия заболевания является наиболее часто используемым предиктором исхода NSCLC (и других видов рака). Однако, хотя стадия обеспечивает общую оценку риска для пациентов со схожими характеристиками, стадирование не позволяет предсказать, у каких отдельных пациентов будет или не будет прогрессировать метастазирование. Гистопатологический анализ, даже если он дополнен геномными или молекулярными биомаркерами, не может точно предсказать метастатический потенциал NSCLC, особенно у пациентов на ранних стадиях.

Ученые отмечают, что использование искусственного интеллекта в медицине может гарантировать более точную диагностику заболеваний, формируемую в результате анализа изображений. Ранее уже были протестированы алгоритмы глубокого обучения (DL от deep learning), способные находить известные диагностические гистопатологические особенности рака простаты. При этом их эффективность и точность были на уровне реальных медиков. Однако использование слабого/неконтролируемого DL для выявления особенностей, которые не могут быть распознаны патологами, таких как потенциал прогрессирования и выживания на основе рутинных гистологических препаратов, изучено менее хорошо.

В рассматриваемом нами сегодня труде ученые демонстрируют, как алгоритм глубокого обучения может быть эффективно обучен на цифровых снимках (слайдах) опухолевой ткани NSCLC, окрашенных H&E (гематоксилином и эозином). Результатом обучения становится способность алгоритма автоматически и точно прогнозировать метастатическое прогрессирование в головном мозге в течение 5 лет после первичного диагноза.

Подготовка к исследованию


Это исследование проводилось по данным пациентов с NSCLC I–III стадии, диагностированным и проходившим лечение в Медицинской школе Вашингтонского университета с долгосрочным наблюдением (> 5 лет или до появления метастазов). Из пациентов, включенных в исследование, у 113 была стадия I, а у 41 — более поздняя стадия заболевания. Один репрезентативный блок опухолевой ткани из зарегистрированной группы из 198 пациентов с NSCLC, ранее не получавших лечения, был использован для создания свежего H&E слайда, который затем сканировали при 40-кратном увеличении с помощью сканера. Клинические характеристики остальных 158 случаев, которые были использованы в этом исследовании [65 с известным метастатическим прогрессированием ЦНС (Met+) и 93 без рецидива (Met-)] описаны в таблице №1 и на изображении №2.


Таблица №1

Среднее время до прогрессирования или время наблюдения в этих когортах составило 12.2 и 106 месяцев соответственно. Все случаи были закодированы, а клинические параметры (стадия и гистология) были неизвестны команде DL. Результаты случаев коррелировали с прогнозами DL только после завершения процессов обучения/валидации и последующего тестирования. Чтобы сравнить способность экспертной патологоанатомической оценки гистопатологии прогнозировать прогрессирование непосредственно с моделью DL, рецензенты-патологи также не знали данных о результатах гистологии и стадиях заболевания.


Изображение №1

Выше показан алгоритм обработки изображений, использованный в этом исследовании. Метод определения порога Оцу был реализован для исключения чистых областей из аннотированных на каждом слайде (WSI от whole-slide image). Из областей интереса (ROI от region of interest) в каждом WSI было случайным образом выбрано 1000 фрагментов изображений, каждый из которых имел 256 х 256 пикселей или 130 х 130 мкм при х20 увеличении, а затем 512 х 512 пикселей при х40 увеличении. В среднем на выбранные фрагменты изображений приходилось около 10% общей ROI при каждом сканировании слайда. Для обучающих наборов увеличение данных, включая случайное кадрирование до размера 224 х 224 пикселей, случайное переворачивание и случайное вращение, было выполнено на нормализованных по цвету изображениях, прежде чем использовать их в качестве входных данных для модели DL. Для наборов валидации и тестирования процесс нормализации цвета был обязательным, но увеличение данных не требовалось.

Модель DL была основана на сверточной нейронной сети ResNet-18, предварительно обученной на наборе данных ImageNet. Линейный слой, соединенный с сигмовидным слоем активации, использовался в качестве классификатора, а результатом была «оценка прогноза» для отдельного фрагмента снимка. То есть фрагменты, которые DL оценил как Met+ (метастазирование будет), по сравнению с фрагментами, которые DL оценил как Met- (метастазирования не будет). Оценки прогнозирования всех отдельных фрагментов снимков из каждого WSI были подвергнуты слою медианного объединения для получения окончательной общей оценки риска прогрессирования для каждого слайда (случая).


Изображение №2

Чтобы избежать потенциальной систематической ошибки при выборе тестового набора из одного эксперимента, ученые разработали три отдельных эксперимента с различным разделением обучения и тестирования (схема выше). Вся группа пациентов была произвольно пронумерована от 1 до 158, а затем рандомизирована. Рандомизированная последовательность пациентов использовалась для разделения когорты на набор обучения/валидации (n = 118; Met+ n = 45, Met- n = 73) и набор тестирования (n = 40; Met+ n = 20, Met- n = 20) в каждом эксперименте, где разные (перекрывающиеся) подгруппы пациентов были выбраны для набора обучения/валидации и совершенно разные (непересекающиеся) пациенты были выбраны для набора тестирования в каждом эксперименте.

Для проведения трех раундов обучения перекрестной валидации для каждого эксперимента вся совокупность обучения/ валидации (118 пациентов) была разделена на обучающую выборку из 88 пациентов (Met+ n = 30, Met- = 58) и валидационную выборку из 30 пациентов (Met+ n = 15, Met- n = 15). В каждом раунде модель обучалась на 88000 фрагментах изображений, полученных из 88 обучающих случаев, и проверялась на 30000 фрагментах изображений, полученных из 30 случаев проверки, с результатами прогрессирования в виде меток обучения и валидации. Процесс обучения/валидации повторялся трижды с использованием другого набора из 88 случаев для обучения и 30 случаев для валидации. С предварительно обработанным набором данных можно ознакомиться на сайте CaltechData, коды доступны на GitHub.

Чтобы оценить эффективность классификатора на основе DL в прогнозировании риска метастазирования, ученые построили кривую рабочей характеристики приемника (ROC от receiver operating characteristic). Площадь под кривой ROC (AUC от area under curve) была рассчитана для оценки общей эффективности модели. Чтобы сравнить результаты модели с результатами клинического прогрессирования, ученые бинаризировали оценки прогнозирования модели и определили показатель точности. Значения p были рассчитаны, чтобы показать характеристики модели по сравнению с характеристиками патологов и случайного классификатора.

Результаты исследования


Поскольку метастазы в головной мозг являются частым явлением прогрессирования NSCLC и не существует клинически полезных гистологических характеристик или биомаркеров, позволяющих предсказать такое поведение, особенно на ранних стадиях заболевания, анализ был сосредоточен на относительно однородной когорте пациентов с четко определенными и клинически значимыми конечными точками (Met+ по сравнению с Met-). Прогностическая эффективность классификатора на основе DL оценивалась в трех раундах с использованием непересекающихся/отдельных/различных пациентов в наборе валидации для каждого раунда, как уже оговаривалось выше. Итоговая AUC после каждого сеанса обучения и валидации, в которой использовались разные случаи, составила 0.96, 0.98 и 0.95 соответственно (3A) с оптимальной чувствительностью 80%, 90% и 95% и специфичностью 90%, 95% и 70% соответственно.


Изображение №3

Напротив, аналогичный сеанс обучения и валидации, в котором использовалось случайное присвоение меток фенотипа прогрессирования, как и следовало ожидать, дал AUC 0.51. Когда оптимальное пороговое значение было выбрано для каждого сеанса обучения/валидации и применено к отдельному набору тестовых случаев, была достигнута средняя точность 87%.

Хоть и не существует надежных гистопатологических признаков, которые можно было бы использовать для прогнозирования риска метастазирования при NSCLC, ученые все же проверили способность четырех независимых экспертов-патологов поставить аналогичный бинарный диагноз на основе идентичного слепого набора слайдов, окрашенных H&E. Врачам были предоставлены WSI, разделенные на те же три тестовых набора, что и для тестирования DL.

По сравнению с обученной моделью DL средняя точность по трем наборам тестов среди четырех патологов составила 55.0%, 60.8%, 54.2% и 59.2% соответственно, при средней точности 57.3%, что существенно не отличается по сравнению с точностью прогнозирования, основанной на обучении случайного классификатора. Индивидуальная чувствительность и специфичность прогноза четырех патологов составила 57%, 93%, 75%, 75% и 53%, 28%, 33%, 43% соответственно. Это позволяет предположить, что модель DL выявила особенности, которые не были легко различимы обученным медиками (такие как степень опухоли, некроз, лимфоцитарная инфильтрация, распространение в пространство дыхательных путей), и что модель DL превзошла результаты тщательного гистологического анализа, проводимого опытными патологами.


Таблица №2

У большинства пациентов, включенных в это исследование, был NSCLC I стадии (таблица №1), и именно у этих пациентов AI/DL может иметь наибольшее влияние. Анализ случаев I стадии показал, что специфичность модели DL в прогнозировании Met- составила 95.7%, а прогностическая ценность отрицательного результата — 92.9% (таблица №2). То есть из 47 случаев, предсказанных моделью как Met-, только два случая привели к метастазам. ИИ был менее точным в прогнозировании пациентов с Met+: чувствительность 74.3%, но положительная прогностическая ценность 83.3% (таблица №2).

Сложность моделей DL может затруднить интерпретацию модели, но структура, использованная в этом исследовании, позволила изучить внимание модели при разрешении на уровне фрагментов по WSI. Хоть модель была обучена и протестирована на 1000 фрагментах изображений в аннотированных областях первичной опухоли и ее микроокружения в каждом случае для определения оценки прогнозирования для каждого фрагмента, оценки прогнозирования были агрегированы по всему изображению, чтобы сделать прогноз на уровне слайда.


Изображение №4

Выше показано несколько примеров таких «карт прогнозирования/внимания», демонстрирующих области, которые DL модель оценила как значимые для определения результата для каждого случая, созданные на основе случаев, правильно идентифицированных как Met+ или Met- моделью DL. Удивительно, но области опухоли, идентифицированные моделью как с высоким или низким риском, имели мало заметных гистологических различий, и в обеих были обнаружены опухолевые клетки, опухолевое микроокружение и бесклеточные стромальные компоненты. Это говорит о том, что при обучении DL учитывался широкий и, возможно, недооцененный набор гистологических особенностей, а не (по крайней мере, не только) характерные ядерные или клеточные характеристики, которые используются в традиционных методах классификации опухолей. Более того, случаи, правильно идентифицированные моделью DL как Met+ и Met-, не обязательно демонстрировали одинаковые оценки на отдельных фрагментах во всем срезе ткани. То есть многие случаи, правильно называемые Met-, тем не менее, содержали элементы (фрагменты), прогнозируемые как высокий риск, и наоборот. Вполне возможно, что такие неправильные выводы были недостатком модели DL или, что более интригующе, отражали известную гетерогенность опухоли в отношении молекулярного фенотипа и метастатического потенциала.

Для более детального ознакомления с нюансами исследования рекомендую заглянуть в доклад ученых.

Эпилог


Рак — это ужасная болезнь, которая съедает человека изнутри как на физическом, так и на психологическом уровне. Онкологические заболевания могут отличаться местом образования, скоростью прогрессирования, тяжестью сопутствующих симптомов, степенью излечимости и т. д. Собрать все типы рака в кучу и вогнать их в какие-то определенные рамки диагностирования сложно, в частности из-за вышеописанных различий. Особенно если речь идет не о диагностировании уже существующего недуга, а о прогнозировании его последствий.

Проблема лечения немелкоклеточного рака легких, как и многих других типов рака, заключается именно в невозможности определения будущего течения болезни. Стоит ли назначать пациенту эффективные, но крайне тяжелые методы терапии (химиотерапия, лучевая терапия или иммунотерапия), чтобы победить рак и снизит вероятность его распространения? Или же стоит выждать определенный период времени после хирургического вмешательства, чтобы понять, помогло оно или нет? Статистика говорит, что у порядка 70% пациентов с раком легких не образуется метастазов в мозге. Проблема в том, что мы не можем со стопроцентной уверенностью определить того или иного пациента в группу счастливчиков или в группу риска.

Авторы рассмотренного нами труда решили использовать машинное обучение для создания алгоритма, способного по снимкам немелкоклеточного рака легких предсказать потенциальный риск метастазирования. Обычно анализом гистологических образцов занимается врач, который может увидеть признаки развития онкологии. Однако, человек — не машина, а потому может совершать ошибки или банально не видеть трудно отличимых особенностей. Хорошо обученный алгоритм может избежать этого.

В ходе исследования алгоритм машинного обучения использовал 118 образцов биопсии легких пациентов с немелкоклеточным раком легких на ранней стадии. Часть из этих пациентов в течение 5 лет наблюдений перешли в стадию ремиссии, а у другой части началось метастазирование в мозге. Алгоритм смог с точностью 87% предсказать риск развития метастазов. Для сравнения, четыре патолога, принявшие участие в исследовании, показали точность в среднем 57.3%. Важно отметить, что алгоритм также точно предсказывал и определял пациентов, у которых не будет метастазов.

Данное исследование не было масштабным, но ученые уверены в том, что их методика может быть крайне полезна в диагностировании онкологических заболеваний. Никто не говорит о том, что ИИ заменит настоящих живых онкологов, но ИИ может стать дополнительным инструментом, который врачи будут использовать для проведения более точных анализов данных пациентов.

Немного рекламы


Спасибо, что остаётесь с нами. Вам нравятся наши статьи? Хотите видеть больше интересных материалов? Поддержите нас, оформив заказ или порекомендовав знакомым, облачные VPS для разработчиков от $4.99, уникальный аналог entry-level серверов, который был придуман нами для Вас: Вся правда о VPS (KVM) E5-2697 v3 (6 Cores) 10GB DDR4 480GB SSD 1Gbps от $19 или как правильно делить сервер? (доступны варианты с RAID1 и RAID10, до 24 ядер и до 40GB DDR4).

Dell R730xd в 2 раза дешевле в дата-центре Maincubes Tier IV в Амстердаме? Только у нас 2 х Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 ТВ от $199 в Нидерландах! Dell R420 — 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB — от $99! Читайте о том Как построить инфраструктуру корп. класса c применением серверов Dell R730xd Е5-2650 v4 стоимостью 9000 евро за копейки?

Комментарии (0)