Голосовые биомаркеры - специфические параметры голоса человека. После "извлечения" их можно проанализировать, выявив те либо иные проблемы со здоровьем того человека, чей голос изучали. Алгоритмы машинного обучения дают возможность значительно увеличить эффективность такого способа определения заболеваний.

Давно уже известно, что изменения речи и ряда параметров голоса человека являются индикатором проблем со здоровьем. Речь идет о нейродегенеративных и легочных заболеваниях, сердечно-сосудистых расстройствах и проблемах с психикой. Пример - нарушение артикуляции или проблемы с произнесением гласных.

В некоторых случаях эти признаки настолько явные, что их без труда может обнаружить и распознать специалист. В других сделать это без помощи технологий крайне сложно, если вообще возможно. Но голосовые биомаркеры и искусственный интеллект способны изменить эту ситуацию.

Что касается самого понятия "биомаркер", то его Национальный институт здравоохранения США (NIH) определяет как "характеристику, которая объективно измеряется и оценивается как индикатор нормальных биологических процессов. Либо же патогенных процессов или фармакологических реакций на терапевтическое вмешательство". Так, биомаркеры крови являются индикатором рассеянного склероза. То же самое и с голосовыми биомаркерами - это такой же индикатор ряда заболеваний.

Можно выделить две основные категории параметров голоса, которые имеют значение для анализа "голосовых биомаркеров". В частности, параметры акустические - частота, амплитуда, тон, высота голоса. Есть и просодические параметры - длина произносимых гласных, темп речи, продолжительность пауз.  Также можно использовать и некоторые лингвистические параметры.

Все эти параметры могут быть связаны с различными показателями состояния организма человека. И точно так же, как искусственный интеллект может поставить диагноз, интерпретируя медицинские изображения, алгоритмы малинного обучения в состоянии идентифицировать и классифицировать отклонения в ходе интерпретации голосовых биомаркеров. Этот способ позволяет быстро ставить предварительный диагноз, который впоследствии уточняет врач. Достоинство методики еще и в том, что она позволяет ускорить процесс диагностирования, а ее стоимость минимальна.

Многоступенчатый процесс анализа

Процесс извлечения и определения голосовых биомаркеров состоит из нескольких этапов. Во-первых, необходимо выбрать тип записи в самом начале процесса. Это может быть вербальная, гласно-слоговая или невербальная вокализация. Во-вторых, нужно собрать аудиоданные - для этого пациентов просят зачитать текст, рассказать что-то о себе, произнести несколько гласных или просто покашлять.

Аудиоданные записываются - по телефону или личном контакте с врачом. А затем анализируется. При этом программное обеспечение выполняет предварительную обработку звука, что включает в себя передискретизацию, уменьшение шума, кадрирование и т.п.

Следующий шаг - определение звуковых характеристик, которые используются для обучения нейросети. По словам авторов идеи, чем точнее обучение, тем эффективнее будет действовать ИИ в дальнейшем. Так, проблемы с гласными звуками характерна для болезни Паркинсона, а вот спонтанная речь - это уже признаки болезни Альцгеймера и/или расстройств психики.

И, конечно, COVID-19

Было бы странно, если бы подобная работа не давала возможность диагностировать COVID-19 и оценивать последствия перенесенного заболевания для пациента. В 2020 году ученые из разных стран активно изучали возможность обнаружения и мониторинга выявленного заболевания. И голосовые биомаркеры - одна из возможностей выполнять такую работу эффективно, причем без посещения врача. Достаточно лишь аудиозаписи голоса пациента и/или кашля, чтобы система могла выявить (или нет) заболевание.

Проект не является чем-то сверхсложным, да и сама идея лежит относительно на поверхности, поэтому занимаются реализацией ученые из разных университетов и стран, включая Кембридж, Институт здоровья Люксембурга, MIT и другие.

В США представители MIT занимались обнаружением признаков болезни Альцгеймера по записи голоса пациента. Отработав технологию еще до наступления пандемии, они смогли применить свою технологию для детекции COVID-19 у пациентов. Для этого в единую систему объединили несколько нейронных сетей.

Определение депрессии по голосу? Конечно!

Как говорится, не ковидом единым. Представители научно-исследовательских организаций разных стран давно занимаются изучением влияния депрессии на коммуникационные способности человека, включая речь. Стоит отметить, что диагностирование депрессии и более серьезных проблем с психикой - сложная задача даже для профессионала. По данным “The Lancet”, правильный диагноз ставят лишь в 47,3% случаев.

Для того, чтобы решить эту проблему, компания Sonde Health разработала технологи, которая позволяет определить депрессию по образцу голоса пациента. Для этого нужен лишь смартфон и приложение. У пациентов, которые страдают депрессией, наблюдаются четкие признаки этой проблемы, и это как раз голосовые маркеры.

Более того, ряд симптомов депрессии, особенно у пожилых людей, является ранним признаком нейродегенеративных патологий.

Телемедицина набирает ход

Проникновение ИИ-технологий в медицину стимулирует развитие удаленной диагностики - когда пациенту не нужно идти в поликлинику для проверки состояния своего организма. Правда, пока что технологии, связанные с этим направлением, лишь развиваются, но можно ожидать, что в ближайшие несколько лет телемедицина станет вполне самостоятельной отраслью в здравоохранении.

Этому помогает повсеместное распространение интернета, мобильных устройств и разработка специализированных приложений и сервисов.

Комментарии (19)


  1. imater
    14.11.2021 19:06
    +2

    На дейликах регулярно провожу подобную диагностику слыша коллег, значит и компьютер это может


  1. kovserg
    14.11.2021 21:31
    -1

    Нахождение и использование закономерностей там где их нет обычно прибыльный бизнес.
    Главное убедить клиента, что в случае неудачи это он что-то не так сделал.

    Проникновение ИИ-технологий в медицину стимулирует развитие удаленной диагностики
    Не всякое проникновение приносит пользу. С нетерпением ждём гадание диагноз по qr-коду.


  1. ClearAirTurbulence
    14.11.2021 22:43
    -1

    Что-то у вас голос сегодня напряжённый, %username%. Пять мотоциклетов с пулеметами уже выехали, прошу не сопротивляться при задержании.


  1. Busla
    14.11.2021 22:49
    +1

    если кому-то как и мне стало любопытно, что за "уши" на КДПВ, то это Parrot Zik 3


  1. Frankenstine
    15.11.2021 10:29
    -1

    Ждём обучения ИИ гаданию на кофейной гуще...


  1. Kanut
    15.11.2021 11:30

    Почему бы и нет. Ну если действительно будет только первая ступень и потом при необходимости всё-таки будет следовать консультация со специалистом.


    1. kovserg
      15.11.2021 13:53

      Почему нет — потому что если это захотят внедрять то не бесплатно (окупиться же должно) и просто получим очередной платный сервис по подписке если вообще что-то вменяемое получится. Чем не устраивают обычные экспертные системы которые которые, задавая вопросы, по симптомам определяют наиболее вероятный диагноз?


      1. Kanut
        15.11.2021 14:19

        Чем не устраивают обычные экспертные системы которые которые, задавая вопросы, по симптомам определяют наиболее вероятный диагноз?

        Ну у этих систем я вижу две проблемки. В первых вопросы у них обычно всё-таки задаются под конкретные болезни. То есть чтобы проверять на "всё на свете" нужно кучу вопросов. И мало кто из людей захочет часами на них отвечать. А вот пробу голоса один раз сдал и её можно пихать в различные системы для анализа.
        А во вторых чтобы системы с вопросами работали, люди должны на них отвечать честно и точно. Что далеко не всегда работает. Мягко говоря.


        1. kovserg
          15.11.2021 15:16

          Вы думаете что при обучении по голосу, будет чем-то лучше?
          Давление, цвет кожи, звук лёгких при дыхании, пульс, ритм сердца, до и после нагрузок — гораздо более информативны чем голос. Тем более что звуковой тракт микрофона и чувствительность микрофона ничем не регламентируется не говоря уже о внешнем фоне. Предполагается само диагностика, так что честность это в интересах того кто тестируется.


          1. Kanut
            15.11.2021 15:28

            Вы думаете что при обучении по голосу, будет чем-то лучше?
            Давление, цвет кожи, звук лёгких при дыхании, пульс, ритм сердца, до и после нагрузок — гораздо более информативны чем голос

            Я считаю что чем больше источников мы используем, тем больше у машины шансов найти какие-то отклонения или предложить какие-то гипотезы. И следовательно меньше шансов что какая-то болезнь останется незамеченной.


            Предполагается само диагностика, так что честность это в интересах того кто тестируется.

            Во первых нет, не предполагается. Потому что есть ещё и вещи вроде обязательных медосмотров. На которых люди вполне себе готовы лгать.


            А во вторых как будто люди не заблуждаются и не обманывают сами себя :)


            1. kovserg
              15.11.2021 15:44

              Я считаю что чем больше источников мы используем, тем больше у машины шансов найти какие-то отклонения или предложить какие-то гипотезы

              Почему бы не использовать более явные каналы информации?
              Зачем измерять давление в шинах по поведению проезжающих мимо вас машин?
              Ведь визуальный осмотр шины и явное измерения давления значительно более надёжно.
              А во вторых как будто люди не заблуждаются и не обманывают сами себя :)

              Тут всё просто если полегчало — хорошо, умер — значит ошибся.


              1. Kanut
                15.11.2021 15:49

                Почему бы не использовать более явные каналы информации?

                A кто сказал что их не надо использовать? Вопрос скорее почему не использовать все имеющиеся? То есть если анализ голоса способен более-менее адекватно определять какие-то отклонения, то почему его не использовать? Особенно учитывая что "давление, цвет кожи, звук лёгких при дыхании, пульс, ритм сердца, до и после нагрузок" не особо помогут при поиски депрессии, или там начинающихся Паркинсона/Альцгеймера.


                Тут всё просто если полегчало — хорошо, умер — значит ошибся.

                Тогда зачем вообще к врачу ходить? Ну по такой же логике можно просто самому себя лечить. Если полегчает, то вообще здорово — кучу денег сэкономишь ....


                1. kovserg
                  15.11.2021 16:23

                  Многие так и делают. А у некоторых есть лечащие доктора. Дело же не в экономии, а в том что изучается «влияние мочи на космические лучи».


                  1. Kanut
                    15.11.2021 16:27

                    Дело же не в экономии, а в том что изучается «влияние мочи на космические лучи».

                    Это ваше мнение. Похоже что люди из того же MIT и ряда других университетов и организций видят это несколько иначе.


                    Ну и как бы как минимум в ряде стран медицинские вещи не получают допуск не пройдя достаточно адекватную сертификацию.


                    1. kovserg
                      15.11.2021 16:43

                      Поживём увидим, но последнее время всё больше продают будущие результаты, которых потом нет или мягко говоря которые очень далеки от первоначальных заявлений.


    1. ClearAirTurbulence
      15.11.2021 14:56

      будет только первая ступень и потом при необходимости всё-таки будет следовать консультация со специалистом

      Ага, прямо как нынешняя ТП в Алиэкспрессе и у многих других.

      Прорваться от бота к человеку практически невозможно, и от человека первой линии к компетентному человеку - тоде непросто.

      Мясные специалисты поддержки - дорогие, так что ждем оптимизаций, и в не столь далёком будущем ситуация, когда "ИИ" с госуслуг поместит кого-нибудь в психушку без права на переписку и апелляцию, перестанет быть фантастикой. А если и доберетесь до человека, он скажет - "у нас нет оснований не доверять экспертному мнению ИИ".


      1. Kanut
        15.11.2021 15:03

        Ага, прямо как нынешняя ТП в Алиэкспрессе и у многих других.

        С другой стороны в куче стран мира уже сейчас всякие CT/MRT сначала прогоняют через программы/ИИ, которые ищут там артефакты. А потом уже человек смотрит являются ли эти артефакты чем-то релевантным и если да, то чем конкретно.


        И такой подход мало того что дешевле и быстрее, так ещё и качественнее. То есть машина и человек вместе делают меньше ошибок чем только человек.


        То есть ясное дело что любую технологию можно использовать неправильно. Но это не делает их автоматически плохими.


  1. CrashLogger
    15.11.2021 14:35

    Ждем появления ботов-мошенников, которые по голосу определяют психическое состояние человека и в зависимости от этого отрабатывают определенный скрипт.


  1. AlexVist
    06.12.2021 16:23

    Где голос и где медицина? Не говоря о том, что ИИ не существует, а есть отдельные моменты связанные с машинным обучением. Только те, кто занимается машинным обучением, обычно, не имеют медицинского образования. А уж про медицинскую практику тут и подавно говорить не приходится.

    Дело не в том, что кто-то против технологий. Просто вызывает сомнение попытки применять во всех случаях. Это уже было и не раз. Вспомните атомные бомбы... Ведь, атом может быть мирным. Хоть и опасным(Чернобыль). Но были попытки применять атомные бомбы в мирных целях. есть несколько случаев. Например взрыв в шахте. Только результат оказался не тем, что планировалось. Почему? потому что необдуманный поступок, мягко говоря.

    Так же и тут. Можно, конечно, проводить и такие исследования. По голосу. Но тут нужно понимать, что одни и те же симптомы или аномалии в голосе могут быть вызваны разными факторами. Это как с головной болью. Если болит, то что? Прописывать всем анальгин? Потому что ИИ так посоветует. Или все же понять различные причины и факторы, которые привели к этому состоянию? А тут и плохое зрение, и давление, и хроническая усталость и... очень много еще чего.

    Или пример из области ИТ чтоб понятнее было. Не работает присоединенное оборудование. А что за причина? Не установлен драйвер, не подключено(отошло в разъеме) устройство, неправильные настройки оборудования, оборудование просто выключено и т.д. и т.п. А в итоге все было. Но нужно было перезагрузить компьютер. Потому что под Windows при повторном подключении устройства в USB оно не определяется. И такие бывают проблемы.

    Суть в том, что одно и то же состояние может быть следствием целого ряда причин. Причем не просто причин, а целой цепочки событий в определенной комбинации. Так же и состояние голоса, если рассматривать в плане "угадывания" вызвавших причин есть процесс более сложный, чем просто построение вероятностной модели ML.

    Даже описанная выше айтишная проблема не может быть решена с помощью ML. При этом решение из множества может определяться всего 5-ю шагами. Технологии нужны и важны. И важно их применять с умом. И разные задачи требует своего подхода и решения. Но определение чего-то там по голосу, по температуре, по весу, по кол-ву лет... в отрыве от многих других факторов - это всего лишь не более чем шарлатанство. Пусть и на модную тему ИИ.

    Кстати, при таком засилии ИИ, отказавшись от нормальных рассуждений, кто и как проверит выводы этого самого ИИ?