Ученые из лаборатории «Компьютерные технологии» Университета ИТМО в составе международной группы исследователей разработали систему Aging.AI — алгоритм определения возраста по результатам базового анализа крови.

В отличие от других разработок эта — более универсальная и точная.

В ходе исследования ученые анализировали наборы данных людей разных национальностей и показали, что такой подход обладает большей предсказательной точностью, нежели разработки, основывающиеся на данных людей, принадлежащих к одной популяции.

Подробнее об этом исследовании читайте в нашем материале.

Фото Aging.AI

Определение точного возраста: почему это важно


Определение биологического возраста — одно из перспективных направлений исследований, связанных с изучением старения. Информация о биологическом возрасте человека (который не всегда может совпадать с хронологическим, или, другими словами, «возрастом по паспорту») может использоваться в будущем при назначении лекарств или при принятии решения о том, сможет ли человек быть донором.

Британские исследователи, работающие в этой сфере, заявляют, что возможность оценить биологический возраст человека (и сопоставить его с хронологическим) может изменить не только медицину, но и другие индустрии — например, страхование, где возраст в ряде случаев является важным показателем скоринга.

Более простая, но тоже нетривиальная задача — поиск биомаркеров, которые позволяют оценить хронологический возраст. Такие биомаркеры, к примеру, могут быть полезным инструментом для оценки терапевтической эффективности препарата или процедуры, направленной на «замедление старения». Именно эта задача — определение хронологического возраста по простым и доступным биомаркерам — и стояла перед учеными Университета ИТМО.

Как проводилось исследование


Чтобы создать алгоритм, предсказывающий возраст по биомаркерам, ученые использовали технологии глубокого обучения. Глубокие нейронные сети (deep neural networks, DNN) были выбраны потому, что, по словам ученых, наиболее эффективно отслеживают скрытые характеристики и могут обучаться на сложных примерах многомерных данных.

Использование DNN позволило ученым отследить нелинейные зависимости между данными анализа крови и хронологическим возрастом пациента. В качестве входных данных для нейронных сетей использовались анонимные данные более 120 тысяч анализов крови пациентов из Канады, Южной Кореи и стран Восточной Европы. Чтобы оценить эффективность своего подхода, ученые сначала использовали три независимые нейронные сети — по одной для каждой популяции.

После этого ученые сравнили результаты их работы с работой нейронной сети, обучавшейся на смешанной выборке, составленной из данных трех датасетов. Все модели использовали 19 параметров стандартного анализа крови (альбумин, глюкоза, гемоглобин и т.д.), а также информацию о поле пациента. Нейросеть, обучавшаяся на смешанной выборке, также анализировала данные принадлежности к той или иной популяции.

«Распределение биомаркеров крови для определения возраста различается в каждой популяции. Мы создали нейронную сеть, которая нивелирует эти различия и может быть использована для любых популяций.

При этом она ведет себя более стабильно и реже ошибается. Также мы выделили ключевые биомаркеры, которые больше других влияют на старение. Среди них – альбумин и глюкоза. Эти данные согласуются с тем, что раньше было известно об изменении этих показателей при старении».

Кирилл Кочетов, один из разработчиков алгоритма

Чтобы оценить работу сетей и отследить их предсказательные возможности, исследователи использовали датасет Национальной программы проверки здоровья и питания (США) — ретроспективные данные лабораторных исследований и демографические данные за период с 1996 по 2016 годы.

Результаты исследования


Национальная принадлежность оказалась одним из наиболее значимых маркеров при оценке возраста — по словам ученых, это может являться следствием «различий в типах старения между разными популяциями».

Как и предполагали ученые, сети, обучавшиеся только на одном однородном датасете, предсказывали возраст людей из другой популяции намного хуже, чем сеть, обучавшаяся на комбинированных данных. В первом случае ошибка в оценке составляла до 10 лет, в то время как итоговый вариант нейронной сети определял возраст с погрешностью менее 6 лет.

Ученые также показали, что сети, обучавшиеся на одном датасете, предсказывают возраст людей той же национальности не лучше, чем нейросеть, обученная на«комбинированных» данных, — еще один аргумент в пользу последней.

Как отмечают ученые, каждый из составляющих анализа крови по отдельности не является точным биомаркером. Однако в случае комплексного анализа сочетание этих параметров позволяет относительно точно определить возраст человека. Подробный анализ полученных данных исследователи приводят в научной статье.

Еще один результат проведенной работы — онлайн-сервис для оценки возраста Aging.AI. Им может воспользоваться любой, у кого есть свежие результаты анализа крови.

Кстати, это не единственное исследование в области медицины, которое проводится при участии ученых и исследователей из Университета ИТМО. О том, какие еще разработки на стыке медицины и ИТ ведутся в Университете, мы рассказывали в этом материале.

Комментарии (8)


  1. HunterNNm
    06.03.2018 22:53

    43 года вместо 26… Мне стоит беспокоиться?


    1. Hardcoin
      07.03.2018 01:55

      Как минимум — свериться с исследованиями по показателям. Вот только интересно — а где сдавали тест? В стандартных тестах крови половины этих показателей нет.


      1. zolkko
        07.03.2018 09:06

        В статье написанно что самое показательное, альбумин, гемоглобин, глюкоза, мочевина и из какого региона, а часть данных наимпьючено.


        Может быть он женщина из канады, а анализы здавал в Чебоксарах?


  1. Frankenstine
    07.03.2018 10:31

    Как отмечают ученые, каждый из составляющих анализа крови по отдельности не является точным биомаркером. Однако в случае комплексного анализа сочетание этих параметров позволяет относительно точно определить возраст человека.

    Возникает вопрос: если есть методика (относительно) точного определения биологического возраста, то зачем нужна нейросеть, дающая те же выходные данные, но с ошибкой ±6 лет?


    1. DnAp
      07.03.2018 11:21

      Нет такой методики. Это ссылка на статью с описанием нейронной сеточки.


      1. Frankenstine
        07.03.2018 13:28
        +1

        В статье есть два утверждения:

        1. Информация о биологическом возрасте человека (который не всегда может совпадать с хронологическим, или, другими словами, «возрастом по паспорту»)
        2. итоговый вариант нейронной сети определял возраст с погрешностью менее 6 лет.

        Значит, существует методика, относительно которой была определена погрешность в ±6 лет для нейронной сети.

        Возможно конечно, что нейросеть определяла лишь хронологический возраст с погрешностью относительно «возраста по паспорту», но тогда она не имеет практического применения для определения биологического возраста, и вопрос стоит так: зачем применять нейросеть если можно посмотреть в паспорт.


  1. u_story
    07.03.2018 22:34

    Возраст на 32% больше и пол не угадал.
    Ввел около 15 показателей из прошлого анализа.


  1. IgorKamenev
    09.03.2018 07:58

    А как определяется «биологический возраст» для обучения? Что является эталоном?
    Очевидно, что при обучении нейросети использовался учитель. Вот только на основе каких данных?