Международная команда исследователей научила нейросеть определять расу по рентгеновским снимкам. Для этого авторы использовали методы машинного обучения и сотни тысяч медицинских снимков грудной клетки, шейного отдела позвоночника, груди и кисти. Обученный алгоритм угадывал расу пациента в 80—99 % случаев.

Даже самые опытные медицинские специалисты периодически совершают ошибки по разным причинам, например, от усталости или высоких нагрузок. Чтобы снизить нагрузку на врачей и повысить точность диагностики и назначаемого лечения, исследователи интегрируют ИИ в медицинские процессы. Кроме того, благодаря нейросети врачи способны обнаружить заболевания на очень ранних этапах развития, что сложно при использовании обычных методов диагностики.  

В 2018 году инженеры научили нейросеть определять на рентгеновских снимках следы различных заболеваний. Авторы опубликовали базу из более чем 50 тысяч снимков, на основе которой тренировали нейросеть методом машинного обучения. Точность ИИ составила около 75 %. В следующем году похожий эксперимент провели стэнфордские инженеры. Их нейросеть научилась различать следы 14 различных патологий на рентгеновских снимках с точностью специалиста-человека. 

Международная команда исследователей под руководством специалистов факультета биоинформатики Эморийского университета в США решила продолжить исследования в данном направлении и проверить, насколько точно работает ИИ и сможет ли он полноценно заменить человека.

По словам авторов, предыдущие исследования в области применения нейросетей в диагностике медицинских снимков показывали неодинаковую производительность ИИ, связанную с различиями между расами. Поэтому они поставили целью выяснить, способна ли нейросеть определить расу человека по медицинским снимкам. 

Для обучения алгоритмов авторы собрали несколько наборов данных, охватывающие разные типы медицинских снимков: рентгенографию грудной клетки (chest x-ray, CXR), компьютерную томографию грудной клетки (chest computed tomography, CT), цифровую рентгенографию кистей рук (digital radiography XR), маммографию и рентгенографию шейного отдела позвоночника (Lateral C-Spine XR). Каждый медицинский снимок включал отметки с классом заболевания и расовой принадлежностью. 

База данных исследования с примерами снимков и разбросом по расам и количеству пациентов 
База данных исследования с примерами снимков и разбросом по расам и количеству пациентов 

Исследователи не уточняют географию пациентов. Они брали снимки из нескольких баз данных:

  • материалы исследования рака лёгких в США National Lung Screening Trial;

  • медицинские снимки Эморийского госпиталя (маммография, рентген и компьютерная томография;

  • открытая база данных Стэнфордского университета, полученная в ходе исследования в 2019 году.

Результаты проверки алгоритмов показали точность определения 80—99 %. Это очень удивило исследователей. Они дополнительно испытали обученную нейросеть на снимках с разным разрешением и обнаружили ожидаемый рост точности по мере роста качества снимков. 

По итогам экспериментов авторы выделили несколько гипотез, объясняющих феноменальную точность алгоритма:

  • алгоритм опирается на разницу в физических характеристиках между пациентами разных расовых групп, например, габитусе тела или плотности грудной клетки;

  • алгоритм ориентируется по специфике заболеваний, например, у чернокожих пациентов чаще встречается диабет и заболевания почек и сердца;

  • алгоритм учитывает специфические характеристики тканей или фенотипические особенности, например, чернокожие имеют более высокую скорректированную минеральную плотность костной ткани, чем белые, и замедленные ежегодные темпы снижения минеральной плотности костной ткани с поправкой на возраст;

  • алгоритм прослеживает совокупные последствия социальных факторов и экологического стресса, например, состояние здоровья, как правило, хуже у чернокожих пациентов. 

Авторы изучили несколько гипотез, но так и не смогли определить, какая из них определяет работу нейросети. Они предположили, что в разных ситуациях алгоритмы ориентируются на разные показатели, но для точного заключения необходимы дальнейшие исследования. 

В будущем учёные планируют экспериментировать с качеством изображений и поочерёдно убирать базовую информацию при обучении алгоритмов. Таким образом они хотят определить ключевые моменты, на которые опирается нейросеть при анализе. 

Материалы исследования опубликованы в статье «Reading Race: AI Recognizes Patient’s Racial Identity In Medical Images» на сайте arXiv.

Комментарии (3)


  1. Goupil
    11.08.2021 15:40

    Интересно - получается что сеть например видит на рентгенограмме специфические изменения тени сердца, характерные для гипертрофии миокарда на фоне гипертонии, изменения легких как следствие курения и меньшую рентгеноплотность костей, что указывает на большую минерализацию - и делает вывод что рентгеновский снимок принадлежит афроамериканцу. Из самой статьи я так не и не понял, шли ли в модель другие фичи (пол, возраст, болезни) или модель выводила их из самих картинок.


    1. ancotir Автор
      11.08.2021 15:55

      При обучении нейросети вместе с картинками давали все данные, указанные в таблице. То есть она располагала информацией о возрасте, поле, болезни и других характеристиках.


  1. vviz
    12.08.2021 13:14
    -1

    Не взлетит. Система не в состоянии отличить афроамериканца от афрокитайца. Всех обзывает черными. Расисты.