Суперкомпьютер Summit Ок-Риджской национальной лаборатории (ORNL), самый быстрый в мире, используется для разработки алгоритмов, которые могут помочь исследователям автоматически проектировать нейронные сети для исследований рака. Это позволит врачам быстрее распознавать характер опухолей.

По оценкам Всемирной организации здравоохранения, к 2025 году число диагностированных новых случаев рака достигнет 21,5 млн в год (сегодня — 18 млн). Сотрудники Ок-Риджской национальной лаборатории и Университета штата Нью-Йорк в Стони Брук считают, что это означает, что врачам придется исследовать около 200 миллионов анализов в год.

Нейронные сети могут помочь облегчить их нагрузки, чтобы врачи могли больше сосредоточиться на уходе за пациентами. Было проведено несколько исследований, описывающих, как можно обучить модели компьютерного зрения диагностировать раковые клетки на снимках. Тем не менее, как пишет The Register, их создание и обучение требует много времени и денег.

Однако команда из ORNL разработала программное обеспечение под названием MENDLL, написанное на Python и способное создавать новые модели нейросетей, которые будут проверять снимки опухолей. Согласно статье, опубликованной на arXiv, миллионы новых моделей могут быть сгенерированы в течение нескольких часов, прежде чем будет выбрана лучшая.

«Конечным результатом является сверхточная нейронная архитектура, которая может искать семь различных типов рака на снимке патологии», — сообщил в комментарии The Register один из авторов программы и исследователь в ORNL Робет Паттон.

Для обучения программы были использованы 86 тысяч снимков, классифицированных вручную. На 64 381 снимке были изображены доброкачественные клетки, на 21 773 — раковые. Всего на снимках запечатлены семь различных типов рака — молочной железы, толстой кишки, легких, поджелудочной железы, предстательной железы, кожи и костей. Лучшая из моделей нейросетей, созданных MENDLL, показала результат в 0,839 балла точности, где 1 балл — идеальный вариант, и могла обрабатывать 7033 снимка в секунду. Для сравнения, разработанная вручную сверхточная нейронная сеть, известная как Inception, немного более точна при 0,899 балла, но может анализировать только 433 снимка в секунду.

Тем временем, в России ученые Сеченовского университета разработали новую программу, работающую на основе искусственного интеллекта, которая позволит быстро проверять анализы крови сразу на 14 биомаркеров и выявить онкозаболевание. Как пишут «Известия», на сегодня в стране такая диагностика не используется. Сейчас пациент должен проходить длительные комплексные обследования, а анализы на онкомаркеры назначаются уже после того, как подозрение на рак подтвердилось. Новая методика позволит выявить тех пациентов, у которых есть подозрение, и отправить их на дополнительные анализы.

Для обучения ИИ в базу были загружены данные 600 пациентов. Программа получила название «ОнкоПро». После проведения исследования сотрудники университета подали четыре заявки на патент. На сегодня запатентованы методики диагностики рака легких и толстого кишечника.

Комментарии (9)


  1. Dimtry44
    02.10.2019 19:43

    но может анализировать только 433 снимка в секунду.
    Сомнительный недостаток. Пусть проверяет 1 снимок в час, но будет точнее. Тут же можно легко горизонтально масштабировать, если надо.

    Думаю что многие раз в год с удовольствием заплатят $10 за час работы инстанса на AWS, чтобы спать поспокойней.


    1. Kanut
      02.10.2019 22:36

      Я думаю то, что её разрабатывали вручную, тоже можно назвать недостатком. Точнее наоборот автоматизированная разработка может стать большим преимуществом для будущих НС. Потому что это по идее снижает стоимость и время самой разработки.


    1. FenixFly
      02.10.2019 22:38

      Нейросети нельзя обучить до 100% точности, в обучающем наборе есть не все примеры болезней или разметка может быть неправильная, про то что только 433 снимка в секунду это недостаток додумал сам автор.


      1. Dimtry44
        02.10.2019 23:02

        Нейросети нельзя обучить до 100% точности
        Это теоретитеческая невозможность или практическая проблема сегоднешнего дня? В конце концов обучающие наборы станут более качественны, количество примеров достигнет небывалых значений, неправильной разметки не будет.


        1. Kanut
          02.10.2019 23:17
          +1

          Вопрос в том что вы хотите определять. Для очень простых вещей уже и сейчас 100% возможны. Например если у вас ограниченный набор вариантов и вы их все даёте НС для тренировки.


          А вот для медицинских целей 100% наверное даже в принципе не достижимы. Потому что все люди разные и более того всевозможные физиологические аномалии/мутации тоже никто не отменял. То есть всегда есть шанс что вашей НС попадётся аболютно "нестандартный" и единственный в своём роде пациент.


        1. FenixFly
          02.10.2019 23:35

          Это теоретическая невозможность. Почти всегда бывает так, что на скане человека полпикселя-здоровые клетки, а другие полпикселя-больные клетки, и человек в одном случае размечает как пиксель с больными клетками, а в другом как со здоровыми.


          1. Dimtry44
            02.10.2019 23:43

            Это теоретическая невозможность. Почти всегда бывает так, что на скане человека полпикселя-здоровые клетки, а другие полпикселя-больные клетки, и человек в одном случае размечает как пиксель с больными клетками, а в другом как со здоровыми.
            Завтра появятся сканеры с 100х разрешением, всё равно теоретическая невозможность?


            1. FenixFly
              03.10.2019 00:16

              Да. Некоторые исследователи собирают датасеты, в которых несколько врачей размечают один и тот же скан — и отношения пересечения их разметок к их объединению может падать ниже 80%, потому что один врач считает одно, а второй другое.


            1. Kanut
              03.10.2019 10:36

              На самом деле 80%-90% выглядит на первый взгляд возможно не особо впечатляюще, но надо понимать что люди тоже ошибаются и местами даже чаще. И в данном случае надо сравнивать не со 100%, а с результатом который выдаёт средний врач.


              И ещё учитывать что люди бывает устают, болеют, думают о своём или отвлекаются на всякие посторонние раздражители. То есть иногда у них квота совсем сильно может упасть.