Центр непрерывного образования

факультет компьютерных наук НИУ ВШЭ

Геоаналитика позволяет взглянуть на привычные данные совершенно иначе, учитывая пространственный и временной контексты. Благодаря этому становится возможным выявление скрытых взаимосвязей и тенденций, таких как плотность спроса, эффективность маркетинговых мероприятий и распределение клиентской базы. Эти знания незаменимы для принятия обоснованных управленческих решений.

В ритейле геоаналитика помогает определять оптимальные места для открытия новых магазинов. Например, сети магазинов могут использовать геоаналитику для контроля и корректировки своих точек. Такой подход позволяет увеличивать трафик и улучшать позиции в поисковой выдаче даже без дополнительных рекламных вложений. Например, на Летней школе по анализу данных от Центра непрерывного образования ФКН НИУ ВШЭ Дарья Горкунова, тимлид DS‑команды в ecom.tech, на практическом примере рассказала о применении геоаналитики для выбора локации дарксторов в труднодоступных районах, выступив с докладом «Геоаналитика: как открыть даркстор в тайге».

В сфере e‑commerce геоаналитика используется для планирования и оптимизации пунктов выдачи заказов. Анализируя тепловые карты онлайн‑заказов, компании могут обоснованно размещать новые пункты выдачи именно там, где наблюдается наибольший спрос, что повышает удобство для клиентов и сокращает логистические издержки. Для ресторанов и кафе геоаналитика позволяет запускать персонализированные акции — например, отправлять специальные предложения клиентам, которые находятся поблизости. Это приводит к росту конверсии и среднего чека: в кейсах российских компаний конверсия при использовании геомаркетинга достигает 8% против 2% в традиционных кампаниях, а средний чек увеличивается с 500 до 650 рублей. И в разных других бизнес‑направлениях геоаналитика приносит прибыль и помогает оптимизировать процессы.

Yandex DataLens предлагает удобные инструменты геоанализа, интегрированные с сервисом Яндекс.Карты. Эта платформа помогает легко создавать интерактивные карты и геовизуализации даже начинающим пользователям. Благодаря таким инструментам аналитики получают возможность быстро оценить расположение клиентов, оптимизировать логистику и повысить качество услуг, опираясь на точные данные о географии своей деятельности.

Платформа Yandex DataLens поддерживает различные типы графиков, позволяющие представлять данные на карте наиболее удобным способом. Рассмотрим все эти виды чуть позднее подробнее, а для начала давайте кратко пройдемся по шагам загрузки своих данных.

Маргарита Бурова

Преподаватель и эксперт Центра непрерывного образования ФКН НИУ ВШЭ, руководитель Edtech-программ по DS и DA Wildberries&Russ

Для визуализации в DataLens вам изначально может быть достаточно следующих типов геоданных:

  • Широта и долгота. Это минимальный и самый универсальный набор для построения точек на карте. Достаточно двух столбцов — latitude (широта) и longitude (долгота).

  • Адресные строки. Если у вас есть только адреса (например, «Москва, ул. Тверская, 1»), их можно преобразовать в координаты с помощью стороннего геокодера, например, API Яндекс Карт.

  • WKT‑полигоны и геополигональные форматы. Для отображения областей (например, районов, регионов, зон покрытия) используются полигоны — замкнутые области на карте, которые можно создать по набору геоточек.

Итак, перейдем к загрузке данных. Для примера я взяла простейшие открытые данные с информацией о городах мира.

Источник: https://simplemaps.com/static/data/world‑cities/basic/simplemaps_worldcities_basicv1.75.zip

Для начала зайдите в DataLens  и нажмите «Создать новое подключение». В открывшемся окне загрузите данные:

В загруженном датасете нажимаем «Создать подключение». Создать подключение в Yandex DataLens — это значит настроить доступ к внешнему источнику данных (например, базе данных, файлу или другому сервису), чтобы затем использовать эти данные для построения датасетов, визуализаций и дашбордов.

После того, как мы нажмем на создание подключения, нам предложат выбрать существующий воркбук или создать новый. Воркбук в Yandex DataLens — это специальный контейнер, в котором хранятся все основные объекты для работы с данными: подключения к источникам данных, датасеты, чарты (графики, диаграммы) и дашборды. Воркбук обеспечивает изолированную среду: все объекты внутри одного воркбука могут ссылаться только друг на друга, что повышает структурированность и управляемость проектов. На скриншоте ниже у меня нет воркбуков, поэтому я создам новый и самостоятельно выберу для него имя.

И далее уже можно нажать «Создать датасет»:

Важным моментом является то, что в DataLens геоточки должны быть записаны в одном списке. В моем наборе данных они были разнесены по двум столбцам (широта и долгота), что встречается часто, но не подходит под DataLens. Поэтому я создам новое поле (столбец), в котором приведу геоточку в читаемый вид.

GEOPOINT — это функция в Yandex DataLens, предназначенная для работы с географическими координатами широты и долготы, что особенно актуально при создании интерактивных карт и визуализаций данных.

Синтаксис функции следующий: GEOPOINT(value_1 [, value_2]), где в качестве аргументов могут выступать либо строка с координатами, либо отдельные значения широты (value_1) и долготы (value_2).

Давайте теперь попробуем собрать визуализацию. Самый простой вариант карт в DataLens — это точечные карты.

Точечные карты — это инструмент, отображающий дискретные объекты с точными географическими координатами. Точечные карты работают с единичными сущностями. Каждая точка соответствует физическому объекту: магазину, банкомату, клиенту, транспортной единице. Их используют тогда, когда хотят посмотреть распределение конкретных объектов и проанализировать его. Также можно менять размер и цвет каждой точки, добавляя информацию о дополнительных параметрах.

Чтобы построить такую визуализацию, надо выбрать тип диаграммы «карта», а далее — «геоточка» и перенести туда поле с созданной ранее (или уже имеющейся) геоточкой.

И после этого мы просто получаем точки на карте. Я загрузила информацию о городах мира, и они отобразились голубыми точками на карте:

Можно настроить размер точек в зависимости от какого‑то признака. Например, от населения. Здесь я специально увеличила карту, чтобы было видно, что точки действительно отображаются разного размера:

Также можно окрашивать точки в разные цвета, зависящие от какого‑либо параметра. Например, можно выбрать колонку «столица», в таком случае Москва на карте становится подсвечена другим цветом:

Второй тип визуализации — это точки с кластеризацией. Для того, чтобы переключиться на него, надо просто заменить тип визуализации «Точки» на «Точки с кластеризацией».

Кластеризация динамически изменяется в зависимости от масштаба карты:

  • При уменьшении масштаба соседние точки объединяются в кластеры, отображаемые кольцевой диаграммой с числом объектов в центре

  • При увеличении масштаба происходит автоматическое разделение кластеров на более мелкие группы или отдельные точки

  • Единичные точки в выбранном масштабе отображаются как стандартные геоточки с возможностью настройки размера и цвета

Один из самых распространённых сценариев — отображение на карте местоположения магазинов, офисов, складов или других объектов компании. Кластеризация позволяет:

  • Быстро оценить плотность размещения точек в разных районах города или страны

  • Избежать наложения маркеров, когда объектов очень много

  • При уменьшении масштаба видеть общее количество точек в кластере, а при увеличении — детализировать до отдельных объектов

Например, в период пандемии COVID-19 точечные карты с кластеризацией использовались для визуализации количества заболевших по регионам или городам. Размер и цвет точки могут отражать количество случаев, а кластеризация помогает анализировать ситуацию на разных уровнях детализации.

Следующий тип визуализации — это тепловая карта. Тепловая карта в DataLens — это вид визуализации, который показывает плотность распределения точек на карте. В DataLens теплокарта строится на основе координат с типом геоточка, как и предыдущие графики. Области на карте окрашиваются градиентом: от зеленого (низкая плотность) к красному (высокая плотность), что позволяет быстро визуально оценить, где наблюдается наибольшее скопление объектов или событий.

Тепловая карта помогает:

  • Выявлять зоны концентрации событий или объектов, которые могут быть неочевидны на обычной точечной карте из‑за наложения точек

  • Анализировать большие массивы геоданных, когда отдельные точки теряют информативность из‑за их количества.

  • Оценивать спрос и предложение на услуги или товары по территории, выявлять «горячие» и «холодные» зоны для бизнеса.

  • Принимать решения о размещении новых объектов (магазинов, офисов, складов и т. д.) или о запуске рекламных кампаний в наиболее перспективных районах

Следующий тип визуализации, который хотелось бы продемонстрировать — это геополигоны. На внешних данных я не могу его продемонстрировать, поэтому разворачиваю тестовые данные, которые предоставляет яндекс, про спрос и предложение на разные услуги и товары.

Геополигон (geopolygon) в Yandex DataLens — это тип геопространственного объекта, который представляет собой замкнутую область на карте, ограниченную линией, проходящей по заданным координатам. Геополигон описывается набором точек (широта и долгота), соединенных в определенном порядке, чтобы образовать многоугольник.

В DataLens для создания геополигонов используется функция GEOPOLYGON, принимающая на вход строку с координатами в формате JSON‑массива. Например:

GEOPOLYGON(“[[[55.79 421,37.65 046],[55.79 594,37.6513],[55.79 642,37.65 133],[55.7969, 37.65 114],[55.79 783, 37.65 098],[55.78 871,37.75 101]]]”)

Геополигоны позволяют визуализировать и анализировать пространственные данные, связанные с определенными территориями или областями. Это ключевой инструмент для геоаналитики, когда нужно работать не с отдельными точками (например, магазинами), а с целыми зонами (районами, регионами, кварталами и т. д.).

Основные задачи геополигонов следующие:

  • Отображение значений показателей по территориям (например, плотность населения, уровень продаж, количество объектов в районе).

  • Визуализация административных границ, зон покрытия, участков с особыми характеристиками.

При отображении спроса на услуги красоты в Москве у меня получился следующий полигон, на котором можно увидеть, что яркость зависит от уровня спроса:

У полигонов достаточно большой спектр применения, например:

  • Сравнение показателей между различными торговыми, логистическими или сервисными зонами, выявление перспективных и проблемных территорий для бизнеса

  • Визуализация зон доставки, обслуживания, покрытия инфраструктуры, а также анализ маршрутов и оптимизация логистических процессов

  • Оценка плотности и распределения объектов инфраструктуры (школы, больницы, магазины), выявление зон с недостаточным покрытием услугами

  • Создание собственных геополигонов для специфических нужд, например, выделение бассейнов рек, зон ЧС, строительных площадок, территорий новых жилых комплексов и т.д

И последний тип визулизаций — это полилинии. Полилинии в Yandex DataLens — это тип геослоя для визуализации на карте, который позволяет отображать линии, построенные из последовательности точек. Такой слой часто используется для показа маршрутов, траекторий движения объектов, логистических путей, велодорожек и других линейных объектов на карте. Полилиния строится из точек (геоточек), каждая из которых хранится в отдельной строке датасета. Из‑за специфичности формата и ограниченного применения в открытых данных, детальный пример в рамках статьи не привожу.

Геопространственная аналитика и визуализация данных в Yandex DataLens требуют базового понимания принципов работы BI‑инструментов и подготовки данных. Если для комфортного прочтения и понимания статьи вам не хватило технической базы, рекомендую начать изучение основ визуализаций с коротких и структурированных курсов. Например, в Центре непрерывного образования ФКН можно пройти специализированную программу повышения квалификации «Аналитика в Business Intelligence», которая включает подробное изучение подготовки данных, работы с различными типами визуализаций и построения дашбордов под конкретные бизнес‑задачи.

Итак, теперь вы знаете, как загрузить свои данные, подготовить их к геовизуализации и построить ее:)

Комментарии (0)