Работа с геоданными имеет определенные сложности. Но когда ты приходишь работать в медицину, этих сложностей становится больше 10 раз.

Геоданных всегда мало. Но в медицине их так много, но но их практически нет, парадокс! Оригинал: ссылка
Геоданных всегда мало. Но в медицине их так много, но но их практически нет, парадокс! Оригинал: ссылка

Как живется геоаналитику в медицине?

С этого поста я хотел бы открыть такую малозаметную тему, как геоаналитика в медицине. COVID-19 со своей пандемией стал своего рода «рубиконом», после которого статьи и работы, основанные на геоданных, по медицинской специфике начали расти как грибы после дождя. В этой статье будет много «воды» и общих слов — я пока только пытаюсь найти те темы, которые будут интересны широкому кругу пользователей. Если вас заинтересовал материал — обязательно дайте обратную связь, это поможет мне быть более последовательным.

Моя история в этой области началась в 2019 году, когда я, будучи студентом 3 курса (еще до пандемии!), попал на практику в крупный федеральный НИИ. Сейчас, в 2025 году, я готовлюсь там же защищать кандидатскую.

За 5 лет работы с медиками я успел понять, как собираются данные в медицине, как они считаются, как хранятся и как анализируются. Но начать хотелось бы с более фундаментального вопроса: существует ли вообще геоаналитика в отрасли, где под термином «железо» чаще понимают скальпели, чем серверы?

#1 Где взять медицинские данные, не работая в системе?

Для начала кратко расскажу, где можно без особых проблем получить хоть какую‑то информацию по медицине, не будучи работником системы. Пару слов о доступных источниках медицинской статистики, которыми может воспользоваться любой:

  1. Сайт с статистикой Всемирной организации здравоохранения. Абсолютно легитимный источник для научных работ. Сама по себе ВОЗ уже весьма авторитетный источник, чтобы использовать его в своих работах, огромное количество литобзоров, ссылок и прочей отчетности. Ценность представляют ежегодные отчеты по конкретным заболеваниям.

  2. Статистическая служба МИАЦ региона. Во всех регионах нашей необъятной существуют единые центры, собирающие статистические данные всех учреждений (в моем случае СПб МИАЦ). Однако ряд медицинских учреждений имеют полномочия не уведомлять МИАЦ о своей отчетности, об этом расскажу в другой раз. Если вам нужно что‑то более специфическое, можете обратиться к следующему источнику.

  3. Статистические и методические отделы НИИ. Одно из лучших мест, где вы можете получить сведения «крупного» масштаба, но с рядом оговорок. Если нужно что‑то конкретное на страну, следует проискать конкретный НИИ, работающих в данной отрасли. В 90% этот НИИ будет подчиняться Роспотребнадзору и на этом ваши поиски будут закончены. Документы, публикуемые данными учреждениями, носят весьма обобщенный характер. Для страны — ок, но более точных сведений рекомендую поискать на сайтах «первичек».

  4. «Первички» — организации, оказывающие непосредственную помощь населению. На удивление неподготовленного пользователя, в здравоохранении именно первички выпускают порой самую подробную информацию о себе же. Пример ниже:

Отдаю должное коллегам из противотуберкулёзной службы Санкт-Петербурга за качественный сбор статистики по городу (ориг: ссылка)
Отдаю должное коллегам из противотуберкулёзной службы Санкт-Петербурга за качественный сбор статистики по городу (ориг: ссылка)

Эти источники — лучший вариант для исследователей и тех, кому интересна медицина, но каждый требует серьезных оговорок:

  • ВОЗ не Россия, Россия не ВОЗ. Хотя там есть всё — от заболеваемости до обеспеченности врачами — методики расчета часто отличаются от российских. Упрощая, показатель «Х» ВОЗ считает по стандарту A, а Минздрав РФ — по стандарту B. Результаты могут различаться. Не критично, но отличия будут и медики их сразу заметят.

  • Сайты некоторых первичных учреждений будто застряли в 2005 году (взгляните на сайт этого учреждения), тогда как другие регионы (вроде Москвы или Татарстана) предоставляют данные в удобных форматах, доступных для скачивания.

Для пользователя «вне» системы здравоохранения это самые доступные источники сведений.

Но главный вопрос: а где собственного геоданные? Как вы догадываетесь из всего этого многообразия их придется делать самому. Ни один из этих источников не дает готовых пространственных данных. Задачи по привязке статистики и геокодированию, проверки валидности координат — это ваша головная боль.

Пример: однажды мы обрабатывали базу с 33.000 адресов потенциальных больных (естественно обезличенную, закон мы уважаем). Привязать к карте удалось чуть больше 27.000 строк (ок. 80% данных). Остальные 20% искались ручками...

Развеиваем миф: манипулируют ли медицинской статистикой?

За 5 лет работы с медицинскими данными я понял главное: утверждения о фальсификациях в статистике здравоохранения — не более чем миф. И вот почему:

  • Многоуровневая проверка отчетов. Да, это работает. Нет, это никому не нравится. Отчеты проверят на уровне орг.отдела учреждения, потом на уровне МИАЦа, а потом на уровне Минздрава. Потому что если цифры не сойдутся на уровне ВОЗ, это будет вопрос уже международного значения. Хочешь привлечь к своей организации лишнее внимание? Тогда сделай ошибку в 1 строке из 5000, проверка тебе обеспечена. Кроме того, наш Минздрав имеет «дурную» привычку перепроверять отчеты прошлых лет, поэтому исправить что то задним числом не получится.

  • Техническая сложность. Подделать заболеваемость или смертность от болячек = переделать десяток бумаг по больным. И не забывайте, что все это дублируется в контролирующих организациях, с которыми не договориться (никак, вот прям никак). Реальность такова: ни один здравомыслящий сотрудник не станет рисковать карьерой ради таких манипуляций.

  • Отсутствие мотивации. Основные статистические показатели не влияют на финансирование, зарплаты и количество выделяемых учреждению кадров. Стали бы вы подделывать отчетность, если за это никто не премирует, но могут наказать?

Уже этих трех аргументов достаточно, чтобы почти полностью доверять предоставляемым данным. Почти полностью. Критическое мышление не повредит, просто помните:

  • Всё вышеописанное не касается COVID-19 (это отдельная и очень сложная тема, требующая написания нескольких научных и научпоп статей)

  • Доверяйте данным, полученным напрямую от источника, ссылайтесь на источник дословно, со всеми пунктами и подпунктами. Один упущенный подпункт гарантирует вам недоверие со стороны медиков.

Наверно как то так должны выглядеть врачи, которые "исправляют" данные. Спасибо за это fusionbrain.ai
Наверно как то так должны выглядеть врачи, которые "исправляют" данные. Спасибо за это fusionbrain.ai

#2 Какие направления геоинформационного анализа популярны в медицине.

Допустим с данными проблем больше нет, мы находимся внутри системы здравоохранения и все дороги нам открыты. Не каждая задача ГИС анализа, вопреки распространенному даже среди картографов и аналитиков мнению, реально решаема или применима на практике. Данное деление — исключительно авторская позиция, основанная на опыте работы с медицинскими учреждениями на практике. Я разделил все задачи медицинской геоаналитики на теоретические и практические.

2.1 Теоретическая медицинская геоаналитика (красиво, но бесполезно).

По сути в этот раздел идут все задачи из разряда «прикольно моделировать/показывать — не прикольно/невозможно применять». В этот пул можно закинуть следующие задачки:

  • Красочные и правильные карты заболеваемости/распространенности/обеспеченности кадрами (иногда с анимацией, иногда без)

  • Веб‑представление данных, дашборды с фильтрами и прочее

  • Анализ «горячих точек», любимых нашими программистами «heatmap» для городов

  • Предсказание на основе ML. Об этом расскажу отдельно

Вывод элементарный: все эти наработки в 90% случаев используются лишь для презентаций. Первичные медучреждения работают с конкретными пациентами, а не с гексогонами или кварталами, в которых ваша модель определила вероятность. К тому же медицина — крайне консервативная отрасль, в которой поверят стандартным эпидемиологическим методам оценки заболеваемости, нежели вашим моделям.

Классический пример: задачи, завязанные на «плече доезда» скорой помощи до каких‑то определенных мест. Вы могли слышать так же и другое называние — «задача коммивояжёра». Результат такого исследования будет выглядеть на схеме как‑то так:

Территориальная доступность медицинской помощи в районах Архангельской области (ориг: ссылка)
Территориальная доступность медицинской помощи в районах Архангельской области (ориг: ссылка)

Очень интересный кейс, позволяющий применить широкий круг базовых навыков в ГИС, начиная от сбора данных, заканчивая полноценным моделированием. Но к сожалению, применить или как‑то практически проверить результаты вашего моделирования не представляется возможным. С вероятностью в 99% такие работы лягут в ваше портфолио и останутся там навсегда.

Другой пример: работа, выполненная мной же совместно с коллегами по научному ремеслу. В ходе совместного исследования мы предприняли попытку выявить взаимосвязи между случаями различных заболеваний в разных районах города. Результаты получились «смешанные»:

  • Обнаружена статистически значимая пространственная кластеризация аэрогенных инфекций (туберкулез, пневмонии) в отдельных муниципальных образованиях;

  • Выявлены муниципалитеты с пересечением инфекций;

  • Не удалось установить причинно‑следственные связи между разными заболеваниями;

  • Влияние социальных факторов ограничено только ценой жилья, что недостаточно для нормальной оценки.

Подробнее можете почитать тут или на моей странице в ResearchGate.

Итог один: геоаналитика может выявить пространственные закономерности заболеваний, но не может предложить конкретные меры для прерывания цепочек передачи. Однако, я упомянул и практическое направление ГИС анализа в медицине, которое все таки может быть полезно медицинским специалистам.

2.2 Практическая медицинская геоаналитика

Как показал мой опыт (в том числе неудачный), принципиальная разница между ГИС‑аналитиком и медиком в постановке вопросов в следующем:

  • Главный вопрос геоаналитика: «где происходит распространение заболевания и как это оценить?»

  • Главный вопрос медика: «почему оно возникло именно здесь и как предотвратить новые случаи?»

Главная ценность хорошего ГИС анализа будет достигнута только тогда, когда получится ответить на второй вопрос!

Приведу пример: когда я предложил медикам самостоятельно определить, чтобы им было интересно узреть/посчитать на аналитической карте с использованием геоданных, мне нарисовали примерно такую картину:

Качество проводимых мероприятий в территории с возникшим случаем заболевания
Качество проводимых мероприятий в территории с возникшим случаем заболевания

Много лет назад в подъезде (красная точка на карте) выявлен случай некоторого заболевания. Требуется охватить анализом следующие явления:

  • Согласно регламенту, в каждом подъезде должно быть осмотрено n% населения на предмет контакта с больным (показывается шкалой у каждого подъезда).

  • Группы риска среди населения (различные квадратики и сердечки)

  • Общее число профосмотров на территории очага (круговая шкала)

Реализовать такую задачку в рамках даже одного района крайне сложно/иногда невозможно:

  • Потребуется не только перебрать больше десятка различных источников данных (разумеется, аналоговых). В первую очередь, это журналы участковых и лечащих врачей, регистры больных из групп риска.

  • Это децентрализованные данные, одни хранятся в больницах, другие в поликлиниках.

  • Систему обновлять нужно ежедневно!

Логичный вопрос: зачем так сложно? Ответ: в медицине только так. На деле только такой подход позволит реально оценить степень воздействия профилактических мероприятий на население, а главное — измерить результат работы (% профилактических осмотров и выявленных случаев). Такие примеры — это реальные запросы учреждений, а не наши теоретические задумки про «оптимальное размещение ФАПов» или «теплокарты заболеваний»

# 3 «Прожить можно» или перспективы ГИС анализа в здравоохранении в 2025 году?

Геоаналитика в медицине, бесспорно, остается самой закрытой, интересной и перспективной отраслью на рынке ГИС.

Попасть «с улицы» в эту отрасль не просто, но специфика задач позволяет применить широкий спектр знаний в практическом поле. Тут работает правило: интересной работы много — неинтересных людей нет.

Про данные: сырых — полно, качественных — дефицит. Впрочем, так сейчас везде.

Резюмируя практическую сторону вопроса работы с геоданными в медицинском учреждении можно утверждать, что задача увязать ГИС и геоданные в цепочке работы медицинской службы — дело очень не простое и крайне непопулярное по ряду причин

С одной стороны, это действительно может упростить работы управляющему звену здравоохранения и позволит вам стать уникальным специалистом, с другой стороны — за это не будут платить столько, чтобы хоть кто‑то готов был этим заняться, а хаос первичного звена даже в топовых медицинских центрах никто не отменял.

Теоретические задачки полезно изучать хотя бы для портфолио: не каждый день удается поработать с точными данными по заболеваниям, тем более будучи географом или аналитиком. Ряд задач, про которые я расскажу в других статьях, действительно требуют нетривиальных знаний предмета.

Почему же стоит попробовать?

  1. Уникальные кейсы для своего портфолио. Медицина реально так отрасль, где надо знать ГИС на уровне «выше среднего»;

  2. Небольшая, но все же возможность влиять на систему здравоохранения в вашем регионе. Здесь много зависит от наставников и партнеров.

  3. Медицинские данные, а к тому же качественные — большая редкость.

Личный совет: Начинайте с малого — локальных пилотных проектов в отдельных учреждениях. Да, они сложные. Да, за них мало платят или не платят вовсе. Да, придется много стучать в «закрытые двери». Но первая качественно составленная карта «растопит» лед недопонимания и сомнений.

На этом всё, спасибо авторам работ за их труд, на который я ссылался в этой статье, берегите свое здоровье и полюбите науку!

P. S. Автор открыт к сотрудничеству — есть несколько интересных тем, где требуются специалисты по эпидемиологии, МЛ в медицине и геоинформатике. Бонус: бесплатный доступ к уникальным медицинским данным, которые мы собираем.

Комментарии (4)


  1. Javian
    31.07.2025 11:26

    Не верю в достоверность каких-то данных - минздрав заинтересован в выполнении неких планов и под результат будут подгонять отчеты.


    1. mapofduty Автор
      31.07.2025 11:26

      Не путайте "верить" с "доверять". Верить/не верить дело ваше. А если доверять, то это немного другое дело...


    1. Yourpaladin
      31.07.2025 11:26

      Что приведешь в качестве доказательной базы своих слов?


      1. Javian
        31.07.2025 11:26

        Из принципа 4 года хожу на Диспансерацию и пишу жалобы на эту потемкинскую деревню. Каждая жалоба в министерство там как фугас.