
Центр непрерывного образования
факультет компьютерных наук НИУ ВШЭ
Геоаналитика позволяет взглянуть на привычные данные совершенно иначе, учитывая пространственный и временной контексты. Благодаря этому становится возможным выявление скрытых взаимосвязей и тенденций, таких как плотность спроса, эффективность маркетинговых мероприятий и распределение клиентской базы. Эти знания незаменимы для принятия обоснованных управленческих решений.
В ритейле геоаналитика помогает определять оптимальные места для открытия новых магазинов. Например, сети магазинов могут использовать геоаналитику для контроля и корректировки своих точек. Такой подход позволяет увеличивать трафик и улучшать позиции в поисковой выдаче даже без дополнительных рекламных вложений. Например, на Летней школе по анализу данных от Центра непрерывного образования ФКН НИУ ВШЭ Дарья Горкунова, тимлид DS‑команды в ecom.tech, на практическом примере рассказала о применении геоаналитики для выбора локации дарксторов в труднодоступных районах, выступив с докладом «Геоаналитика: как открыть даркстор в тайге».
В сфере e‑commerce геоаналитика используется для планирования и оптимизации пунктов выдачи заказов. Анализируя тепловые карты онлайн‑заказов, компании могут обоснованно размещать новые пункты выдачи именно там, где наблюдается наибольший спрос, что повышает удобство для клиентов и сокращает логистические издержки. Для ресторанов и кафе геоаналитика позволяет запускать персонализированные акции — например, отправлять специальные предложения клиентам, которые находятся поблизости. Это приводит к росту конверсии и среднего чека: в кейсах российских компаний конверсия при использовании геомаркетинга достигает 8% против 2% в традиционных кампаниях, а средний чек увеличивается с 500 до 650 рублей. И в разных других бизнес‑направлениях геоаналитика приносит прибыль и помогает оптимизировать процессы.
Yandex DataLens предлагает удобные инструменты геоанализа, интегрированные с сервисом Яндекс.Карты. Эта платформа помогает легко создавать интерактивные карты и геовизуализации даже начинающим пользователям. Благодаря таким инструментам аналитики получают возможность быстро оценить расположение клиентов, оптимизировать логистику и повысить качество услуг, опираясь на точные данные о географии своей деятельности.
Платформа Yandex DataLens поддерживает различные типы графиков, позволяющие представлять данные на карте наиболее удобным способом. Рассмотрим все эти виды чуть позднее подробнее, а для начала давайте кратко пройдемся по шагам загрузки своих данных.

Маргарита Бурова
Преподаватель и эксперт Центра непрерывного образования ФКН НИУ ВШЭ, руководитель Edtech-программ по DS и DA Wildberries&Russ
Для визуализации в DataLens вам изначально может быть достаточно следующих типов геоданных:
Широта и долгота. Это минимальный и самый универсальный набор для построения точек на карте. Достаточно двух столбцов — latitude (широта) и longitude (долгота).
Адресные строки. Если у вас есть только адреса (например, «Москва, ул. Тверская, 1»), их можно преобразовать в координаты с помощью стороннего геокодера, например, API Яндекс Карт.
WKT‑полигоны и геополигональные форматы. Для отображения областей (например, районов, регионов, зон покрытия) используются полигоны — замкнутые области на карте, которые можно создать по набору геоточек.
Итак, перейдем к загрузке данных. Для примера я взяла простейшие открытые данные с информацией о городах мира.
Источник: https://simplemaps.com/static/data/world‑cities/basic/simplemaps_worldcities_basicv1.75.zip
Для начала зайдите в DataLens и нажмите «Создать новое подключение». В открывшемся окне загрузите данные:

В загруженном датасете нажимаем «Создать подключение». Создать подключение в Yandex DataLens — это значит настроить доступ к внешнему источнику данных (например, базе данных, файлу или другому сервису), чтобы затем использовать эти данные для построения датасетов, визуализаций и дашбордов.

После того, как мы нажмем на создание подключения, нам предложат выбрать существующий воркбук или создать новый. Воркбук в Yandex DataLens — это специальный контейнер, в котором хранятся все основные объекты для работы с данными: подключения к источникам данных, датасеты, чарты (графики, диаграммы) и дашборды. Воркбук обеспечивает изолированную среду: все объекты внутри одного воркбука могут ссылаться только друг на друга, что повышает структурированность и управляемость проектов. На скриншоте ниже у меня нет воркбуков, поэтому я создам новый и самостоятельно выберу для него имя.

И далее уже можно нажать «Создать датасет»:

Важным моментом является то, что в DataLens геоточки должны быть записаны в одном списке. В моем наборе данных они были разнесены по двум столбцам (широта и долгота), что встречается часто, но не подходит под DataLens. Поэтому я создам новое поле (столбец), в котором приведу геоточку в читаемый вид.

GEOPOINT — это функция в Yandex DataLens, предназначенная для работы с географическими координатами широты и долготы, что особенно актуально при создании интерактивных карт и визуализаций данных.
Синтаксис функции следующий: GEOPOINT(value_1 [, value_2]), где в качестве аргументов могут выступать либо строка с координатами, либо отдельные значения широты (value_1) и долготы (value_2).
Давайте теперь попробуем собрать визуализацию. Самый простой вариант карт в DataLens — это точечные карты.
Точечные карты — это инструмент, отображающий дискретные объекты с точными географическими координатами. Точечные карты работают с единичными сущностями. Каждая точка соответствует физическому объекту: магазину, банкомату, клиенту, транспортной единице. Их используют тогда, когда хотят посмотреть распределение конкретных объектов и проанализировать его. Также можно менять размер и цвет каждой точки, добавляя информацию о дополнительных параметрах.
Чтобы построить такую визуализацию, надо выбрать тип диаграммы «карта», а далее — «геоточка» и перенести туда поле с созданной ранее (или уже имеющейся) геоточкой.
И после этого мы просто получаем точки на карте. Я загрузила информацию о городах мира, и они отобразились голубыми точками на карте:

Можно настроить размер точек в зависимости от какого‑то признака. Например, от населения. Здесь я специально увеличила карту, чтобы было видно, что точки действительно отображаются разного размера:

Также можно окрашивать точки в разные цвета, зависящие от какого‑либо параметра. Например, можно выбрать колонку «столица», в таком случае Москва на карте становится подсвечена другим цветом:

Второй тип визуализации — это точки с кластеризацией. Для того, чтобы переключиться на него, надо просто заменить тип визуализации «Точки» на «Точки с кластеризацией».
Кластеризация динамически изменяется в зависимости от масштаба карты:
При уменьшении масштаба соседние точки объединяются в кластеры, отображаемые кольцевой диаграммой с числом объектов в центре
При увеличении масштаба происходит автоматическое разделение кластеров на более мелкие группы или отдельные точки
Единичные точки в выбранном масштабе отображаются как стандартные геоточки с возможностью настройки размера и цвета
Один из самых распространённых сценариев — отображение на карте местоположения магазинов, офисов, складов или других объектов компании. Кластеризация позволяет:
Быстро оценить плотность размещения точек в разных районах города или страны
Избежать наложения маркеров, когда объектов очень много
При уменьшении масштаба видеть общее количество точек в кластере, а при увеличении — детализировать до отдельных объектов
Например, в период пандемии COVID-19 точечные карты с кластеризацией использовались для визуализации количества заболевших по регионам или городам. Размер и цвет точки могут отражать количество случаев, а кластеризация помогает анализировать ситуацию на разных уровнях детализации.

Следующий тип визуализации — это тепловая карта. Тепловая карта в DataLens — это вид визуализации, который показывает плотность распределения точек на карте. В DataLens теплокарта строится на основе координат с типом геоточка, как и предыдущие графики. Области на карте окрашиваются градиентом: от зеленого (низкая плотность) к красному (высокая плотность), что позволяет быстро визуально оценить, где наблюдается наибольшее скопление объектов или событий.
Тепловая карта помогает:
Выявлять зоны концентрации событий или объектов, которые могут быть неочевидны на обычной точечной карте из‑за наложения точек
Анализировать большие массивы геоданных, когда отдельные точки теряют информативность из‑за их количества.
Оценивать спрос и предложение на услуги или товары по территории, выявлять «горячие» и «холодные» зоны для бизнеса.
Принимать решения о размещении новых объектов (магазинов, офисов, складов и т. д.) или о запуске рекламных кампаний в наиболее перспективных районах

Следующий тип визуализации, который хотелось бы продемонстрировать — это геополигоны. На внешних данных я не могу его продемонстрировать, поэтому разворачиваю тестовые данные, которые предоставляет яндекс, про спрос и предложение на разные услуги и товары.

Геополигон (geopolygon) в Yandex DataLens — это тип геопространственного объекта, который представляет собой замкнутую область на карте, ограниченную линией, проходящей по заданным координатам. Геополигон описывается набором точек (широта и долгота), соединенных в определенном порядке, чтобы образовать многоугольник.
В DataLens для создания геополигонов используется функция GEOPOLYGON, принимающая на вход строку с координатами в формате JSON‑массива. Например:
GEOPOLYGON(“[[[55.79 421,37.65 046],[55.79 594,37.6513],[55.79 642,37.65 133],[55.7969, 37.65 114],[55.79 783, 37.65 098],[55.78 871,37.75 101]]]”)
Геополигоны позволяют визуализировать и анализировать пространственные данные, связанные с определенными территориями или областями. Это ключевой инструмент для геоаналитики, когда нужно работать не с отдельными точками (например, магазинами), а с целыми зонами (районами, регионами, кварталами и т. д.).
Основные задачи геополигонов следующие:
Отображение значений показателей по территориям (например, плотность населения, уровень продаж, количество объектов в районе).
Визуализация административных границ, зон покрытия, участков с особыми характеристиками.
При отображении спроса на услуги красоты в Москве у меня получился следующий полигон, на котором можно увидеть, что яркость зависит от уровня спроса:

У полигонов достаточно большой спектр применения, например:
Сравнение показателей между различными торговыми, логистическими или сервисными зонами, выявление перспективных и проблемных территорий для бизнеса
Визуализация зон доставки, обслуживания, покрытия инфраструктуры, а также анализ маршрутов и оптимизация логистических процессов
Оценка плотности и распределения объектов инфраструктуры (школы, больницы, магазины), выявление зон с недостаточным покрытием услугами
Создание собственных геополигонов для специфических нужд, например, выделение бассейнов рек, зон ЧС, строительных площадок, территорий новых жилых комплексов и т.д
И последний тип визулизаций — это полилинии. Полилинии в Yandex DataLens — это тип геослоя для визуализации на карте, который позволяет отображать линии, построенные из последовательности точек. Такой слой часто используется для показа маршрутов, траекторий движения объектов, логистических путей, велодорожек и других линейных объектов на карте. Полилиния строится из точек (геоточек), каждая из которых хранится в отдельной строке датасета. Из‑за специфичности формата и ограниченного применения в открытых данных, детальный пример в рамках статьи не привожу.
Геопространственная аналитика и визуализация данных в Yandex DataLens требуют базового понимания принципов работы BI‑инструментов и подготовки данных. Если для комфортного прочтения и понимания статьи вам не хватило технической базы, рекомендую начать изучение основ визуализаций с коротких и структурированных курсов. Например, в Центре непрерывного образования ФКН можно пройти специализированную программу повышения квалификации «Аналитика в Business Intelligence», которая включает подробное изучение подготовки данных, работы с различными типами визуализаций и построения дашбордов под конкретные бизнес‑задачи.
Итак, теперь вы знаете, как загрузить свои данные, подготовить их к геовизуализации и построить ее:)