Как сближение медицины и Data Science открывает новое направление деятельности. И что наука о работе с данными может привнести в российское здравоохранение уже в ближайшие несколько лет.

Попова Елена. Студент Geek University, факультет Искусственного интеллекта
Попова Елена. Студент Geek University, факультет Искусственного интеллекта

Я врач – работаю по специальности терапия уже скоро пять лет. Профессия мне нравится – она даёт навыки, которых не получишь больше нигде. Но в последнее время мне стало не хватать возможностей для самореализации: нынешний круг задач – не то, чему я хотела бы посвятить жизнь. Тем более, работать приходится в условиях российской системы здравоохранения, которая, на мой взгляд, отстает в развитии. Что ж, за осознанием проблемы должны следовать действия.

Всё началось с того, что в медицинской и научной литературе мне стали регулярно попадаться на глаза термины «Искусственный интеллект», «Анализ больших данных», Data Science (наука о работе с данными). Тогда я ещё не очень представляла себе, что стоит за каждым из этих понятий и как связанные с ними технологии могут изменить отрасль. Но я была заинтригована, и чем больше погружалась в тему, тем интереснее мне становилось.

 Долгое время практическая медицина была очень далека от сферы информационных технологий. Ещё два десятка  лет назад это были почти не соприкасающиеся друг с другом миры. Однако ближе к 2010-му году IT-решения начали активно интегрироваться практически во все сферы жизни. И медицина в этом смысле не исключение, скорее наоборот – одно из направлений, где применение новых технологий наиболее заметно и востребовано.

Особенно вдохновляюще выглядят проекты по фолдингу белка и последние сообщения СМИ о том, что применение искусственного интеллекта помогло обнаружить новый перспективный антибиотик. Как врач я знаю, что за последние годы большой шаг вперёд сделала компьютерная обработка медицинских изображений, в частности,  рентгеновских снимков. Да и вообще, обработка данных для последующего  принятия решений – фундамент, на котором строится работа любого врача. Без этого постановка диагноза и лечение невозможны. А вычислительные системы и искусственный интеллект могут ускорить поиск решения и минимизировать риск ошибки.

 В какой-то момент я поняла, что применение достижений Data Science в медицине – именно то, чем мне хотелось бы заниматься. Но сначала я сомневалась, стоит ли в 28 лет кардинально менять направление деятельности. Изучила вопрос подробнее, пообщалась со знакомыми медиками, которые используют в работе ИИ, поняла, что это очень востребованное направление, есть много подобных интересных кейсов, и да, это сложный, но очень подходящий мне путь.Интересно работать на пересечении двух сфер, каждая из которых бурно развивается!

 Нынешняя эпидемия дала огромный толчок для развития медицинских технологий. Эта область и раньше считалась перспективной, а сейчас её актуальность стала очевидна всему миру. Здравоохранению приходится подстраиваться под ситуацию, преодолевать свою ригидность, в том числе. Поэтому я считаю, что в следующие несколько лет стоит ждать взрывного роста на рынке medtech. Уже сейчас появилась возможность дистанционной продажи лекарств и сняты некоторые ограничения на телемедицину. Искусственный интеллект в борьбе с эпидемией играет не последнюю роль – он действительно помогает в анализе данных и выработке лучших схем лечения.

Что есть у нас сегодня

Сейчас даже в самой простой государственной поликлинике врачи не пишут ничего от руки, как это было всего несколько лет назад. Все российские поликлиники сейчас подключены к единой медицинской информационно-аналитической системе (ЕМИАС). В ней хранятся данные о диагнозах, о каждом посещении пациентом  специалистов, результаты обследований и даже показатели с фитнес-трекеров. Кстати, с недавнего времени всю информацию из своей медицинской карты вы можете просматривать в специальном приложении.

Но самое главное – ЕМИАС накапливает огромные массивы данных о здоровье населения и работе врачей. Анализ этих данных в перспективе позволит лучше контролировать и корректировать работу системы здравоохранения.

Другое очень интересное направление, которое сейчас активно развивается – это телемедицина. И, конечно, мы уже пользуемся системами автоматизированного анализа рентгеновских снимков. Практика показала, что искусственный интеллект  справляется с этой задачей не хуже докторов.

Я не думаю, что ИИ в обозримом будущем заменит собой врача, но то, что он даст огромный толчок развитию медицины, уже очевидно. Сегодня он уже расширяет возможности специалистов-генетиков, разработчиков медицинского оборудования и лекарств.

 Перечислять все возможные области применения ИИ в медицине можно было бы на протяжении целой статьи, но у нас другая тема. Поэтому перейду лучше к рассказу о том, как я начала изучать Data Science и что из этого получается.

Перспективы трудоустройства

Прежде чем осваивать новую специальность, я исследовала рынок труда, причём вакансии аналитика данных искала именно в области медицины. Я не собиралась конкурировать с техническими специалистами широкого профиля, но выбрала для себя нишу, где нужны специалисты со знанием медицины и информационных технологий. Мне удалось найти подобные вакансии, их количество и параметры меня устроили. К тому же, я поняла, что у IT-специалиста возможностей для трудоустройства гораздо больше, чем у врача, особенно если рассматривать работу за рубежом.

 Итак, вакансии есть. Уверенность в том, что специалисты в области аналитики медицинских данных будут востребованы и через пять, и через 10 лет – тоже. Тема здравоохранения всегда была актуальна, а в современном мире интерес к ней только увеличивается. Всё больше людей следят за своим здоровьем, готовы вкладывать в это время и деньги. По моим наблюдениям, тема новых технологий в медицине сейчас только набирает популярность, рынок ещё не полностью сформирован и будет развиваться. Следовательно, число вакансий будет расти.

Быстрое погружение в новые технологии

В начале пути у меня не было опыта в программировании и достаточной математической базы для работы с большими массивами данных. Поэтому я искала образовательный проект, где можно было начать освоение Data Science «с нуля». В итоге выбрала программу GeekUniversity, которая включала базовые курсы по математике и востребованному в аналитике языку Python.

 За время обучения я начала смотреть на многие вещи в своей работе под другим углом, стала замечать неочевидные пути решения проблем, с которыми сталкиваюсь ежедневно. Например, когда я работаю с медицинскими информационными системами, обращаю внимание на то, как их можно улучшить, как найти им более широкое применение и расширить их возможности.

У меня появились идеи для нескольких проектов, которые я хотела бы реализовать:

  • Автоматизация аускультации («выслушивания» фонендоскопом) с помощью машинного обучения. Для этой задачи даже специальное оборудование создавать не придется. В свободной продаже уже есть фонендоскопы с функцией записи, которые могут передавать запись на внешнее устройство, например, на смартфон.

  •  Экспертная система, которая поможет врачам принимать решения и анализировать эффективность схем лечения. В рамках ЕМИАС уже есть готовая база знаний, которая позволяет анализировать данные из множества учреждений. Как получить эти данные, конечно, вопрос, но предположу, что создатели системы будут стараться расширить область её применения. Кроме того, немало подобных баз данных можно найти в открытом доступе – на Kaggle, например.

  • Система долгосрочного мониторинга и предиктивной аналитики состояния здоровья пациентов.

 После года учебы и экспериментов с кодом я уже представляю, как должны работать подобные системы, и чувствую в себе силы попробовать реализовать задуманное.

Портфолио

В рамках курса я успела реализовать два проекта из области предиктивной аналитики:

?       предсказание кредитоспособности клиентов банка (https://www.kaggle.com/serpensa/creditscoreproj)

?       предсказание стоимости недвижимости, исходя из её свойств (https://github.com/Serpensa/Python4DS/blob/master/ProjectP4DS.ipynb)

 Для решения этих задач понадобилось задействовать практически весь арсенал изучаемых инструментов и методов. Чтобы на основе данных смоделировать ситуацию и просчитать её возможные последствия, прежде всего нужно было выбрать, какие данные показательны, а какие лучше игнорировать. Оценить важность тех или иных признаков помогает матрица корреляции. С её помощью в огромном массиве разрозненных показателей вы начинаете прослеживать связи и зависимости.

 Например, в работе над системой кредитного скоринга – начисления заёмщикам баллов «благонадёжности» – мы на реальных данных выяснили, что наличие жилищной ипотеки гораздо больше сказывается на платежеспособности клиента, чем просто сам факт наличия жилья. А средний для клиента размер займа более показателен, чем размер наибольшего непогашенного на данный момент кредита.

 В проекте по оценке недвижимости удалось выявить множество коррелирующих между собой признаков, влияние которых на конечную стоимость не сильное, но на основе которых можно отнести жилье к тому или иному классу. Например, на цену недвижимости влияет степень развития инфраструктуры. Дальше мы анализировали все значимые факторы и делали предсказания по стоимости объектов.

Совместить работу и учёбу: трудно, но возможно

Честно, сложно. Но и не могу сказать, что невозможно. Основную сложность для меня составляет то, что, всё таки нужно оставаться хорошим специалистом в своей области, а это тоже требует много времени и трудозатрат. Так что, да, эти две области постоянно друг с другом соперничают, и очень важно сохранять баланс. Кроме того, мой график работы зачастую «конфликтует» с расписанием  вебинаров, так что приходится смотреть их в записи.

 На работе я свою учебу ни от кого не скрываю. Относятся к этому, в основном, нейтрально. Большинство врачей о современных технологиях и тем более об ИИ имеют весьма расплывчатое представление.

 Каждый день я стараюсь выделять на обучение не меньше двух часов. Главное –  мне нравится и интересно учиться. А когда занятие в радость, два часа в сутки для него всегда можно найти.

Препятствия и их преодоление

 Сложнее всего поначалу мне давалось программирование.  Когда сталкиваешься с новой областью знаний впервые, бывает трудно разобраться в самых базовых вещах, которые позже начинают казаться простыми и очевидными. И на самом трудном, начальном, этапе, очень важно, чтобы кто-то мог вам подсказать и помочь советом. Мне в этом плане повезло – у меня довольно много друзей и знакомых в сфере IT, плюс я всегда могу обратиться к преподавателям на курсах, получить обратную связь по сделанным работам и узнать, что в них можно улучшить.

 Очень важно не бояться задавать вопросы и просить помощи, вступать в коммуникации с теми, кто знает больше. К тому же, поскольку на основной своей работе и в повседневной жизни я с программированием не сталкиваюсь, свежие знания в этой области могут очень быстро уходить в пассив и выветриваться. Поэтому пройденный материал я обязательно конспектирую, чтобы удобнее было его периодически повторять. И когда тот или иной инструмент потребуется на практике, всегда можно будет перечитать конспект и вспомнить базовые вещи.

 На мой взгляд, в любом учебном процессе важнее всего – самодисциплина. Чтобы получить результат, обязательно выработать у себя привычку учиться. Когда вы из раза в раз преодолеваете непонимание и заставляете себя вникать в сложные темы, это становится нормой и частью вашей повседневной жизни.

Ожидания и реальность

Пока мои ожидания от учёбы оправдываются. Так как ранее я с этой сферой совсем не сталкивалась, все предметы считаю для себя полезными. Конечно, что-то вызывает больший интерес, что-то меньший, но в моем случае даже поверхностные знания в какой-то области помогают формированию более целостной картины.

Самыми интересными для меня оказались курсы программирования на Python, курсы, непосредственно по Data Science, а также статистика и математика. Непривычно  было погружаться в такие типично программистские темы, как архитектура операционных систем, например. Но аналитику нужно в этом разбираться, чтобы грамотно использовать инфраструктуру заказчика, ведь работа с большими данными требует серьёзных ресурсов. Специалист, который умеет извлекать больше полезных сведений с меньшими затратами, ценен для работодателей, потому что экономит их деньги.

 Когда я приступала к обучению, даже не представляла, что со временем буду знать и уметь всё то, что знаю сегодня. Но я с самого начала настраивалась на серьёзную работу, большей частью самостоятельную. И этот подход полностью оправдывает себя. Учёба дает мне план, сроки, темы, задания. А то, насколько глубокие и крепкие знания я приобрету, зависит уже полностью от меня.