«‑ Мне ведь замуж пора выходить, Клавдия Матвеевна, а Володя — подходящая кандидатура.

— Для тебя?

— Да! Даже ЭВМ это подтвердила.

— Ну если ЭВМ… Я, конечно, с ЭВМ тягаться не могу. Ну, вообще, у меня мозги, а не перфокарты. Но знаю точно — он тебе не пара. Вот Лёха Пряхин — в самый раз»

Введение

Выбрать правильное место для размещения магазина — ключевая задача в розничной офлайн торговле.

Отраслевые эксперты любят золотое правило трёх самых важных в ритейле «L» (конечно, это «Location», «Location» и еще раз «Location») уже давно.

Сегодня к адептам этого правила присоединились еще и аналитики и data scientist’ы в больших подразделениях сетевых розничных компаний, девелоперов и агентств недвижимости, а также разработчики геосервисов. К слову сказать, правило это тут же преобразовалось в «Location», «Context», «Mobility».

Терминологическая база тоже заметно разрослась, — вокруг цифровизации розничного бизнеса и торговой недвижимости закружились десятки buzzwords типа «data‑driven decision making», «explainable AI», «open data».

Разных подходов к поиску оптимального местоположения точек продаж различных форматов придумано за время существования розничной торговли довольно много.

Об одном из них — определении оптимальных мест для размещения дарксторов я написала здесь в прошлом году.

Все подходы объединяет необходимость найти такое место, где сочетание определенных показателей (демографических, социально‑экономических, близость к заданным объектам недвижимости, транспортная доступность и т. д.), является оптимальным [6].

При этом сегодня, когда мир наводнили большие данные и AI — алгоритмы для их обработки, закономерным и эффективным способом определения лучшего месторасположения стало применение искусственного интеллекта для анализа геопространственных данных (эти технологии получили название Geospatial Artificial Intelligence или GeoAI).

Крупные розничные сети используют большие данные и геосервисы с поддержкой AI при планировании развития сети, оценке рынка сбыта и оптимизации цепей поставок.

За относительно недолгое время cформировался набор типовых сервисов для определения оптимального месторасположения магазинов. Один из них описан в этой статье.

Location Intelligence и GeoAI – это новое название чего-то давно известного?

В применяемых в ритейле технологиях можно найти многое из гравитационных моделей и пространственного взаимодействия, разработанных еще в 20-м веке [1].

Подобные модели применялись для определения границ «зон охвата» магазинов, определение спроса на товары в заданных областях, прогнозирования транспортных потоков, перемещений людей, решения задач городского и регионального анализа.

Что изменилось с тех пор - так это объёмы геоданных и вычислительные мощности

Сегодня, во времена «бесконечного железа» облачных провайдеров, доступных больших геоданных и алгоритмов машинного обучения, использование математических моделей с пространственными переменными стало значительно эффективнее, чем вычисления того времени.

Когда говорят о применении машинного обучения для обработки больших геоданных, обычно в первую очередь вспоминают анализ высокоточных изображений поверхности Земли (спутниковых снимков, аэрофотоснимков, снимков БПЛА и др.), распознавание на них объектов и извлечение информации с использованием машинного зрения [9].

Однако использование AI уверенно растёт и в других геоинформационных направлениях, - разработке цифровых двойников, развитии беспилотного транспорта, управлении умными городами, геоаналитических сервисах для сравнительного анализа рынка недвижимости и страхования и др.

Появились интересные примеры прогнозной аналитики (например, прогнозирование выручки розничной точки в той или иной локации, или пешеходного трафика с учётом планов по развитию транспортной сети и так далее).

Наука о пространственных данных пока считается развивающейся областью, что делает рынок геопространственного анализа привлекательным и для разработчиков, и для инвесторов.

Использовать большие данные и машинное обучение для анализа окружения потенциально инвестиционно-привлекательных торговых помещений с каждым годом становится всё более эффективным благодаря:

  1. демократизации доступа к качественным наборам геоданных, совместимых между собой (как открытых, так и коммерческих), постепенному развитию партнёрств по обмену данными между государственными и частными компаниями;

  2. возможности использования доступных вычислительных мощностей в облаках провайдеров. По мере того, как облачные вычисления становятся более рентабельными, растёт и точность моделей машинного обучения;

  3. развитию рынка специализированных отраслевых решений геопространственной аналитики, геопространственных инструментов и сервисов;

  4. появлению облачных платформ, способных использовать множество источников геоданных, где пользователи могут визуализировать и анализировать в комплексе геоданные, полученные от разных компаний-партнёров, и учитывать их влияние друг на друга и прогнозные значения параметров;

  5. возможности использования ПО с открытым исходным кодом для анализа геопространственных данных.

Если крупные игроки сетевой розницы уже давно уверенно используют машинное обучение и технологии location intelligence для решения многих своих задач, то для других компаний реализация подобных проектов становится доступной только сейчас, благодаря перечисленным выше тенденциям и широким возможностям современных платформ.

В этой статье я опишу способ определения месторасположения путем поиска «территорий - близнецов (или двойников)» (Area Twins), который используется для поиска локаций, максимально похожих на те, где уже работают самые эффективные точки продаж сети.

Алгоритм поиска двойников территорий применяется не только в ритейле и коммерческой недвижимости, но и в других отраслях (с использованием соответствующих отраслевых наборов данных и критериев).

Звучит круто, но я ничего не понял

Чтобы оценить торговое помещение и его окружение для инвестиций, нужно проанализировать много разнородной информации.

Современные геоаналитические системы и сервисы помогают аналитикам использовать большие данные и алгоритмы искусственного интеллекта для оценки инвестиционной привлекательности торговых помещений, выбора оптимальных локаций для открытия точек продаж, прогнозирования выручки в зависимости от месторасположения, и решения других подобных задач.

Стремительно развиваются отраслевые специализированные сервисы, которые позволяют решить, где правильно разместить что бы то ни было (от магазина до буровой установки), не сильно вовлекаясь в детали поиска и подготовки геоданных, построения и обучения ML‑моделей и тонкости визуализации результатов анализа.

Хорошая геоаналитическая система помогает:

  1. Найти и подготовить внешние данные (например, данные из Росреестра, кадастровые и другие данные из API государственных и коммерческих компаний);

  2. При необходимости собрать самостоятельно, или с привлечением подрядчика или crowdsourcing с применением специализированных мобильных приложений сбора «полевых» данных;

  3. Подключить внутренние системы для анализа определенных данных компании‑заказчика (например, адреса лучших точек, их выручку и другие характеристики для сравнения и обучения модели машинного обучения);

  4. Использовать на своих данных уже разработанные отраслевые модели машинного обучения для вычислений и прогнозирования;

  5. Использовать геоаналитические сервисы, настраивать цифровые карты и информационные панели, работать с картами разным сотрудникам в соответствии с правами доступа;

  6. Быстро организовать ситуационный центр или центр мониторинга состояния географически распределённых активов;

  7. Обеспечить возможность для сотрудников разных подразделений «перейти на самообслуживание» в части доступа и анализа геоданных, не привлекая всегда занятых специалистов из команд ИТ и Data Science.

А задача-то какая? Оценки моего аналитического отдела и так точные

Конечно, c завидным ростом числа доступных сервисов и демократизации доступа к геоданным никто не отменял ни интуицию принимающих инвестиционные решения специалистов в ритейле или коммерческой недвижимости, ни усидчивость и добросовестность сотрудников аналитических отделов и отделов мониторинга.

На рынке ритейла и торговой недвижимости много успешных компаний, не искушённых толпами штатных ИТ‑аналитиков и data scientist»ов или внешних консультантов. Они в ходе анализа инвестиционной привлекательности помещений или планировании открытия новых магазинов применяют очень ограничено или не применяют совсем специализированные геопространственные сервисы и большие данные. В рамках проектов по внедрению GeoAI мы часто сталкиваемся с разного уровня консервативности экселями, фотографиями помещений и вывесок, и элегантными ИТ‑системами начала века.

Но при этом (к нашей большой радости и воодушевлению) почти у всех компаний растёт интерес и к GeoAI решениям.

Происходит это потому, что даже не расположенные к долгим размышлениям об инновациях и Big Data акционеры и опытные оценщики и ритейлеры понимают, что интуиция хорошо работает на ограниченном количестве объектов и в заданных районах и городах.

А если есть планы быстро развернуть большую сеть, или управлять большим портфелем объектов недвижимости или сетью франчайзи, то нужно уметь относительно быстро и недорого провести анализ, желательно с использованием качественных и совместимых между собой данных.

«Всё понятно, но что конкретно»

Дополнительные возможности, которые даёт применение технологий GeoAI для рынка коммерческой недвижимости и розничной торговли офлайн, такие:

  1. Масштаб бизнеса. Для решения задачи запуска нескольких новых магазинов или приобретения с инвестиционной целью несколько объектов коммерческой недвижимости в год могут быть использованы и проверенные временем таблицы Excel c адресами  (ИТ-консультанты раньше элегантно обозначали этот подход в своих презентациях как «бизнес-процесс поддерживается программным комплексом Excel»).

    Для запуска же большой сети магазинов или массового приобретения с последующей продажей объектов недвижимости этого может быть недостаточно.

  2. Новые регионы. Традиционно поиск областей для расширения розничного бизнеса представляет собой сложный процесс, который требует использовать так называемый «локальный опыт». Использование геоданных и аналитических инструментов Location Intelligence и GeoAI, даёт возможность искать новые локации для расширения сети без углубленного изучения новых регионов «на месте», большую часть работы проводить в формате «кабинетной оценки», не выезжая из офиса. Эта возможность востребована и у консультантов, задействованных в сделках M&A.

  3. Все участники процесса в одном месте. Также заметным бонусом использования геоаналитических платформ является то, что весь сквозной бизнес-процесс (включая поиск, сбор и подготовку данных, визуализацию данных на карте, аналитику и моделирование, использование результатов анализа в последующих работах и процессах, подготовку отчётов для инвесторов и руководителей и тд,) выполняется на одной платформе, используемой всеми подразделениями компании и партнёрами.

    Модели машинного обучения анализируют большие данные лучше, чем самые опытные специалисты, выполняют поиск в большем количестве наборов геоданных, используют больше переменных, чтобы обнаружить закономерности, обеспечивают более высокую скорость и точность.

    В сочетании с возможностями интеграции внутренних данных компании с данными из различных внешних источников и использованию уже готовых отраслевых специализированных сервисов (например, поиск лучшей локации для стрит-ритейла, или прогнозирование выручки аптеки), современные технологии позволяют быстро масштабировать бизнес.

И что, кого-то это интересует?

Выбор оптимального месторасположения («Site Selection») востребован во многих отраслях.

Если говорить о ритейле, то это все те бизнес‑модели, где точек продаж много, а ключевые показатели бизнеса значительно зависят от того, где эти точки географически размещены. Это сетевые магазины, рестораны, кофейни и аптеки, операционные офисы крупных банков и банкоматы, пункты выдачи заказов, постаматы и вендинговые автоматы, распределительные центры, сетевые автозаправки (со временем и пункты зарядки электромобилей), торговые центры, парковки для самокатов и т. д..

При планировании открытия или закрытия, перемещения или консолидации точек продаж можно использовать уже готовые и протестированные в заданном городе модели и наборы данных.

Смежные с ритейлом специалисты из коммерческой недвижимости, инвестиционные фонды недвижимости, логистические компании тоже внимательно изучают возможности прогнозирования выручки, пешеходного и автомобильного трафика, стоимости аренды или покупки недвижимости на основании данных в контексте месторасположения того или иного объекта.

Для владельцев недвижимости и застройщиков, управляющих компаний важно иметь представление как о текущей рыночной стоимости всех объектов недвижимости, так и прогнозировать изменение стоимости с учётом планов строительства дорог, метро, комплексного развития территорий и многих других параметров.

Интерес к геопространственным сервисам подтверждается отчетами аналитиков. Также надежду на развитие рынка геопространственных технологий дает то наблюдение, что известные консалтинговые компании организовали у себя центры компетенции по геопространственной аналитике и стали использовать соответствующие инструменты и геоданные в своих проектах и исследованиях [3].

А кто у меня будет это делать?

При использовании специализированных геопростраственных решений и сервисов анализ геоданных выполняется без кодирования совсем (no-code) или с применением простой консоли с использованием команд SQL (low-code).

Для проведения анализа пользователю не нужно глубоко погружаться в знания в области GeoAI, или проходить курсы по программированию на Python. Сотрудник создает готовое решение, не программируя, а «собирая» его из готовых блоков.

Поэтому геоаналитиками могут стать сотрудники любого подразделения.

Существующие бизнес-аналитики и инвестиционные аналитики, маркетологи:

  1. получают доступ к актуальным качественным геоданным (состав наборов данных зависит от задачи);

  2. получают понятный инструмент для визуального определения плюсов и минусов определенных локаций (например, сколько покупателей живет на определенном расстоянии от конкретного магазина и сколько времени им требуется, чтобы дойти или доехать до него, сколько рядом пунктов выдачи wildberries или ozon и др., сколько рядом конкурентов, попадает ли объект недвижимости в определенную область покрытия и т. д.);

  3. используют геоданные в качестве переменных для создания прогнозных моделей (например, для выручки в точке продаж в заданной локации, определения потребностей у клиентов будут в будущем, сколько будет стоить тот или иной объект недвижимости в этом месте, как именно влияет на продажи изменение того или иного критерия и т. д.);

  4. быстро создают нужные отчёты и презентации для инвестиционных комитетов и акционеров, исследований в рамках маркетинговых стратегий и планов развития бизнеса.

Сотрудники и руководители бизнес‑ и операционных подразделений получают интерактивные карты и оперативную информацию по территориально‑распределенным бизнес‑процессам / своим подразделениям / точкам продаж, и могут принимать решения в контексте физического окружения.

Ответственные за развитие региональной сети или сети франчайзи сотрудники совместно работают с картами и объектами на них, быстро анализируют данные и согласуют размещение новых точек продаж с учётом расположения уже существующих, публикуют карты для доступа всех участников процесса, готовят отчёты.

Техническая поддержка геоаналитической платформы может осуществляться как обычно, как на стороне компании‑разработчика, так и на стороне ИТ‑подразделения компании‑заказчика, или гибридный вариант (например, первая линия поддержки — на стороне Заказчика, вторая и третья — выполняется компанией — разработчиком).

Формат методологической поддержки и консалтинга — тоже настраивается в зависимости от требований и бюджета.

Отраслевые решения для ритейла

Типовые кейсы применения геопространственного анализа для ритейла:

  1. Выявление пространственных кластеров с высокими и низкими значениями исследуемых параметров (Hotspot Analysis)

  2. Поиск областей‑двойников (Twin Area Analysis)

  3. Моделирование выручки планируемого магазина с учётом его месторасположения и окружения (Revenue Prediction)

  4. Расчёт коммерческой ёмкости месторасположения (White Space Analysis)

Зачем искать двойников

Область, в которой находится точка продаж, характеризуется набором определенных характеристик, например, пешая доступность, конкуренты по соседству и т. д. [6].

Если у компании уже есть несколько работающих точек продаж, и ясно, какие из них работают лучше остальных, то понятным желанием становится разместить новые точки в районах, максимально похожих на те, где работают лучшие.

Для этого нужно сравнить характеристики области, в которой размещен самый прибыльный магазин с характеристиками каждой исследуемой области, и выбрать наиболее похожие.

В этом и состоит метод поиска двойников территорий («Twin Area»).

Как мы применили метод Twin Area

Наша задача состоит в том, чтобы найти для открытия новых пунктов аренды оборудования для ремонта такие области, которые максимально похожи по набору параметров на те, где уже работают самые удачные пункты. В этом случае самыми удачными мы считаем точки с максимальной дневной выручкой.

Для этого применяем процедуру поиска двойников территорий. Работает она так:

  1. Входными параметрами для поиска двойников  является список магазинов сети с наиболее высокой выручкой. Для каждого магазина задан набор атрибутов (адрес, размер торговой площади и ряд других).

  2. Результатом расчёта станут области, наиболее похожие на исходные по значениям заданного набора переменных.

Шаг 1 «Определение критериев для сравнения областей»

Выбираем параметры, по которым будем сравнивать области. Параметры зависят от бизнеса.

Мы руководствовались простыми соображениями:

  1. чем ближе к местам проживания, тем лучше;

  2. чем больше рядом точек притяжения «наших» клиентов, тем лучше (например, если кто‑то ходит пешком в пункт выдачи заказов WB или Ozon, то ему будет интересно по пути зайти и в наш пункт, или если он приехал на строительный рынок, то и к нам зайдёт) и т. д..

Критерии разделили на 4 направления:

  1. Численность потенциальных покупателей

  2. Транспортная доступность

  3. Рыночный спрос

  4. Конкуренты

Для расчета использовали открытые данные из публичных источников с учетом отраслевой специфики.

Шаг 2 «Построение «зон обслуживания» вокруг работающих точек продаж»

Для всех работающих магазинов строим «зоны обслуживания». Зоны обслуживания строим путем определения карты изохром — областей пешеходной или транспортной доступности от точки продаж во всех направлениях за заданный промежуток времени.

Для нашей задачи мы выбрали изохромы 20-ти минутной пешеходной доступности.

Зоны 20-ти минутной доступности пешком
Зоны 20-ти минутной доступности пешком

Шаг 3 «Разделение территории Москвы на одинаковые шестиугольники»

Процесс определения сетки необходим для того, чтобы иметь возможность сравнивать области одинакового размера.

Территория Москвы была разбита на гексагоны. Сетка построена с использованием пространственных индексов h3. Гексагоны h3 — это система геокодирования, которая делит поверхность Земли на равные шестиугольные ячейки.

В проекте использовались гексагоны h3 уровня вложенности 9, размер одной грани 173 метра, площадь — 0,1 км2. Всего таких гексагонов получилось ~10 000 шт.

Для снижения количества объектов для анализа в расчет были включены гексагоны, имеющие пересечения хотя бы с одним жилым или административным зданием.

Для каждого гексагона был построен изохром пешей доступности. Каждый изохром был обогащен данными.

Шаг 3 «Обогащение данных каждого исследуемого изохрома»

Для получения большей информации о локальном окружении каждого магазина, были собраны, очищены и обработаны следующие данные из открытых источников:

  1. Остановки общественного транспорта, шт;

  2. Вестибюли метрополитена, шт;

  3. Ёмкость платных парковок, шт;

  4. Торговые центры, м2;

  5. Бизнес центры, м2;

  6. Строительные рынки, шт;

  7. Строительные моллы, шт;

  8. Жилые здания, м2

Обогащенные изохромы
Обогащенные изохромы

Шаг 4 «Построение векторов для исходной и целевых изохром»

Обогащаем полученные изолинии теми значениями, которые мы рассчитали.

Рассчитываем значение в каждой области для каждого критерия. Например, сколько в исследуемую область «попало» пунктов выдачи заказов маркетплейсов, сколько квадратных метров торговых центров и т. д.

Получили данные для построения вектора характеристик существующих объектов, по которым мы и сможем сравнивать области.

Для каждой изолинии строим вектор из рассчитанных значений. Для этого дополняем каждую построенную область данными из внешних наборов геопространственных данных,

Шаг 5 «Исключение парных корреляций»

Чтобы модель была более точной, нужно исключить параметры, которые зависят друг от друга (т. н. парные корреляции).

Для этого строим матрицу корреляции Пирсона. Коэффициент корреляции Пирсона — это мера линейной связи между двумя переменными.

Обнаружена незначительная корреляция между показателями «Количество остановок», «Количество вестибюлей метро» и «Площадь жилых зданий».

Матрица Пирсона
Матрица Пирсона

Шаг 6 «Сравнение локаций путем расчёта косинусного расстояния»

Расчёт показателя сходства между исходным месторасположением и набором исследуемых областей будем проводить путём вычисления косинуса угла между вектором области, где размещен лучший магазин, и вектором каждой исследуемой области.

Из школьной тригонометрии помним, что косинус угла в 0 градусов равен единице, т. е., чем ближе к единице косинус, тем два вектора более похожи.

Рассчитываем косинусы углов между вектором исходной области и вектором каждой исследуемой области (далее будем называть это значение «коэффициент схожести»).

Те области, для которых коэффициент схожести близок к единице, и будут искомыми областями — двойниками.

Результаты процедуры поиска областей‑двойников для выбранного исходного местоположения представлены ниже:

На этой карте показан показатель сходства для всех исследуемых гексагонов с положительным результатом в Москве: более высокие оценки указывают на области, более похожие на исходное местоположение.

Заключение

Возросшая доступность больших геопространственных данных, развитие искусственного интеллекта и вычислительных мощностей создали импульс для использования геопространственных данных во всех отраслях.

Технологии искусственного интеллекта создают новые возможности для геопространственного анализа и прогнозирования.

На примере применения одного из нескольких типовых методов определения оптимального месторасположения (поиск областей‑двойников или Twin Area) мы видим, как технологии Location Intelligence и GeoAI могут использоваться в сетевом ритейле и управлении коммерческой недвижимостью, и стать широко используемым инструментом для развития бизнеса.

Термины и Определения (осторожно, есть buzzwords)

  1. Геопространственный искусственный интеллект (GeoAI) — это дисциплина искусственного интеллекта, которая использует машинное обучение для извлечения знаний из пространственных данных.

  2. Наука о пространственных данных (Spatial Data Science)‑ это развивающаяся область, ориентированная на методы обработки, управления, анализа и визуализации пространственных больших данных, предоставляющая возможности для получения динамической информации из сложных пространственных явлений.

  3. Дистанционное зондирование Земли (далее — ДЗЗ) — это получение информации о поверхности Земли и объектах на ней бесконтактными методами, при которых регистрирующий прибор удалён от объекта исследований на значительное расстояние. Дистанционное зондирование Земли — это еще один способ получения пространственных данных, например, с изображений со спутниковых датчиков.

Литература

  1. Gravity and Spatial Interaction Models, Kingsley E. Haynes, A. Stewart Fotheringham, 1985 г. https://researchrepository.wvu.edu/rri-web-book/16/,

  2. Spatial interaction modeling using artificial neural networks, Author: William R Black, Journal of Transport Geography, September 1995, Spatial interaction modeling using artificial neural networks - ScienceDirect

  3. PwC Middle East Location Intelligence Services, https://www.pwc.com/m1/en/services/deals/pwc-middle-east-location-intelligence-services.html,

  4. Future Trends in geospatial information management: the five to ten year vision – THIRD EDITION, Global Geospatial Information Management August 2022 (Microsoft Word - CONSULTATION DRAFT_Future Trends_v1.0 (un.org))

  5. What is AI GIS (Artificial Intelligence GIS)? February, 2020 https://www.supermap.com/en-us/news/?82_2701.html

  6. Как выбрать удачную локацию для торгового помещения?, Руслан Сухий, август 2020 г. https://vc.ru/trade/153446-kak-vybrat-udachnuyu-lokaciyu-dlya-torgovogo-pomeshcheniya?ysclid=ldlmjqsniu238907859

  7. Sources of VGI for Mapping Linda See, Jacinto Estima , Andrea Pődör, Jamal Jokar Arsanjani, Juan-Carlos Laso Bayas, and Rumiana Vatseva

  8. Ритейл возглавил рейтинг сфер-лидеров по цифровизации в России, https://new-retail.ru/novosti/retail/riteyl_vozglavil_reyting_sfer_liderov_po_tsifrovizatsii_v_rossii2835/

  9. «Как беспилотники оцифровывают поля» https://vc.ru/u/1324628-leader-id/527541-kak-bespilotniki-ocifrovyvayut-polya

  10. https://cyberleninka.ru/article/n/podhody-k-geomarketingu-raspolozheniya-ofisov-obsluzhivaniya-fizicheskih-i-yuridicheskih-lits-kommercheskogo-banka

Комментарии (1)


  1. psionik
    00.00.0000 00:00
    +1

    добрый день, подскажите пожалуйста клиентов вашей компании - какие у них результаты в этих точках при использовании только вашего софта? и есть ли у вас в команде кто нибудь с точки зрения работы в реальном бизнесе, поиска и открытии каких либо точек продаж (какой-нибудь Директор развития из реального бизнеса)? я правильно понял что вы предлагаете какое то решение по геопозицианированию какой либо точки продажи?