«‑ Мне ведь замуж пора выходить, Клавдия Матвеевна, а Володя — подходящая кандидатура.
— Для тебя?
— Да! Даже ЭВМ это подтвердила.
— Ну если ЭВМ… Я, конечно, с ЭВМ тягаться не могу. Ну, вообще, у меня мозги, а не перфокарты. Но знаю точно — он тебе не пара. Вот Лёха Пряхин — в самый раз»
Введение
Выбрать правильное место для размещения магазина — ключевая задача в розничной офлайн торговле.
Отраслевые эксперты любят золотое правило трёх самых важных в ритейле «L» (конечно, это «Location», «Location» и еще раз «Location») уже давно.
Сегодня к адептам этого правила присоединились еще и аналитики и data scientist’ы в больших подразделениях сетевых розничных компаний, девелоперов и агентств недвижимости, а также разработчики геосервисов. К слову сказать, правило это тут же преобразовалось в «Location», «Context», «Mobility».
Терминологическая база тоже заметно разрослась, — вокруг цифровизации розничного бизнеса и торговой недвижимости закружились десятки buzzwords типа «data‑driven decision making», «explainable AI», «open data».
Разных подходов к поиску оптимального местоположения точек продаж различных форматов придумано за время существования розничной торговли довольно много.
Об одном из них — определении оптимальных мест для размещения дарксторов я написала здесь в прошлом году.
Все подходы объединяет необходимость найти такое место, где сочетание определенных показателей (демографических, социально‑экономических, близость к заданным объектам недвижимости, транспортная доступность и т. д.), является оптимальным [6].
При этом сегодня, когда мир наводнили большие данные и AI — алгоритмы для их обработки, закономерным и эффективным способом определения лучшего месторасположения стало применение искусственного интеллекта для анализа геопространственных данных (эти технологии получили название Geospatial Artificial Intelligence или GeoAI).
Крупные розничные сети используют большие данные и геосервисы с поддержкой AI при планировании развития сети, оценке рынка сбыта и оптимизации цепей поставок.
За относительно недолгое время cформировался набор типовых сервисов для определения оптимального месторасположения магазинов. Один из них описан в этой статье.
Location Intelligence и GeoAI – это новое название чего-то давно известного?
В применяемых в ритейле технологиях можно найти многое из гравитационных моделей и пространственного взаимодействия, разработанных еще в 20-м веке [1].
Подобные модели применялись для определения границ «зон охвата» магазинов, определение спроса на товары в заданных областях, прогнозирования транспортных потоков, перемещений людей, решения задач городского и регионального анализа.
Что изменилось с тех пор - так это объёмы геоданных и вычислительные мощности
Сегодня, во времена «бесконечного железа» облачных провайдеров, доступных больших геоданных и алгоритмов машинного обучения, использование математических моделей с пространственными переменными стало значительно эффективнее, чем вычисления того времени.
Когда говорят о применении машинного обучения для обработки больших геоданных, обычно в первую очередь вспоминают анализ высокоточных изображений поверхности Земли (спутниковых снимков, аэрофотоснимков, снимков БПЛА и др.), распознавание на них объектов и извлечение информации с использованием машинного зрения [9].
Однако использование AI уверенно растёт и в других геоинформационных направлениях, - разработке цифровых двойников, развитии беспилотного транспорта, управлении умными городами, геоаналитических сервисах для сравнительного анализа рынка недвижимости и страхования и др.
Появились интересные примеры прогнозной аналитики (например, прогнозирование выручки розничной точки в той или иной локации, или пешеходного трафика с учётом планов по развитию транспортной сети и так далее).
Наука о пространственных данных пока считается развивающейся областью, что делает рынок геопространственного анализа привлекательным и для разработчиков, и для инвесторов.
Использовать большие данные и машинное обучение для анализа окружения потенциально инвестиционно-привлекательных торговых помещений с каждым годом становится всё более эффективным благодаря:
демократизации доступа к качественным наборам геоданных, совместимых между собой (как открытых, так и коммерческих), постепенному развитию партнёрств по обмену данными между государственными и частными компаниями;
возможности использования доступных вычислительных мощностей в облаках провайдеров. По мере того, как облачные вычисления становятся более рентабельными, растёт и точность моделей машинного обучения;
развитию рынка специализированных отраслевых решений геопространственной аналитики, геопространственных инструментов и сервисов;
появлению облачных платформ, способных использовать множество источников геоданных, где пользователи могут визуализировать и анализировать в комплексе геоданные, полученные от разных компаний-партнёров, и учитывать их влияние друг на друга и прогнозные значения параметров;
возможности использования ПО с открытым исходным кодом для анализа геопространственных данных.
Если крупные игроки сетевой розницы уже давно уверенно используют машинное обучение и технологии location intelligence для решения многих своих задач, то для других компаний реализация подобных проектов становится доступной только сейчас, благодаря перечисленным выше тенденциям и широким возможностям современных платформ.
В этой статье я опишу способ определения месторасположения путем поиска «территорий - близнецов (или двойников)» (Area Twins), который используется для поиска локаций, максимально похожих на те, где уже работают самые эффективные точки продаж сети.
Алгоритм поиска двойников территорий применяется не только в ритейле и коммерческой недвижимости, но и в других отраслях (с использованием соответствующих отраслевых наборов данных и критериев).
Звучит круто, но я ничего не понял
Чтобы оценить торговое помещение и его окружение для инвестиций, нужно проанализировать много разнородной информации.
Современные геоаналитические системы и сервисы помогают аналитикам использовать большие данные и алгоритмы искусственного интеллекта для оценки инвестиционной привлекательности торговых помещений, выбора оптимальных локаций для открытия точек продаж, прогнозирования выручки в зависимости от месторасположения, и решения других подобных задач.
Стремительно развиваются отраслевые специализированные сервисы, которые позволяют решить, где правильно разместить что бы то ни было (от магазина до буровой установки), не сильно вовлекаясь в детали поиска и подготовки геоданных, построения и обучения ML‑моделей и тонкости визуализации результатов анализа.
Хорошая геоаналитическая система помогает:
Найти и подготовить внешние данные (например, данные из Росреестра, кадастровые и другие данные из API государственных и коммерческих компаний);
При необходимости собрать самостоятельно, или с привлечением подрядчика или crowdsourcing с применением специализированных мобильных приложений сбора «полевых» данных;
Подключить внутренние системы для анализа определенных данных компании‑заказчика (например, адреса лучших точек, их выручку и другие характеристики для сравнения и обучения модели машинного обучения);
Использовать на своих данных уже разработанные отраслевые модели машинного обучения для вычислений и прогнозирования;
Использовать геоаналитические сервисы, настраивать цифровые карты и информационные панели, работать с картами разным сотрудникам в соответствии с правами доступа;
Быстро организовать ситуационный центр или центр мониторинга состояния географически распределённых активов;
Обеспечить возможность для сотрудников разных подразделений «перейти на самообслуживание» в части доступа и анализа геоданных, не привлекая всегда занятых специалистов из команд ИТ и Data Science.
А задача-то какая? Оценки моего аналитического отдела и так точные
Конечно, c завидным ростом числа доступных сервисов и демократизации доступа к геоданным никто не отменял ни интуицию принимающих инвестиционные решения специалистов в ритейле или коммерческой недвижимости, ни усидчивость и добросовестность сотрудников аналитических отделов и отделов мониторинга.
На рынке ритейла и торговой недвижимости много успешных компаний, не искушённых толпами штатных ИТ‑аналитиков и data scientist»ов или внешних консультантов. Они в ходе анализа инвестиционной привлекательности помещений или планировании открытия новых магазинов применяют очень ограничено или не применяют совсем специализированные геопространственные сервисы и большие данные. В рамках проектов по внедрению GeoAI мы часто сталкиваемся с разного уровня консервативности экселями, фотографиями помещений и вывесок, и элегантными ИТ‑системами начала века.
Но при этом (к нашей большой радости и воодушевлению) почти у всех компаний растёт интерес и к GeoAI решениям.
Происходит это потому, что даже не расположенные к долгим размышлениям об инновациях и Big Data акционеры и опытные оценщики и ритейлеры понимают, что интуиция хорошо работает на ограниченном количестве объектов и в заданных районах и городах.
А если есть планы быстро развернуть большую сеть, или управлять большим портфелем объектов недвижимости или сетью франчайзи, то нужно уметь относительно быстро и недорого провести анализ, желательно с использованием качественных и совместимых между собой данных.
«Всё понятно, но что конкретно»
Дополнительные возможности, которые даёт применение технологий GeoAI для рынка коммерческой недвижимости и розничной торговли офлайн, такие:
-
Масштаб бизнеса. Для решения задачи запуска нескольких новых магазинов или приобретения с инвестиционной целью несколько объектов коммерческой недвижимости в год могут быть использованы и проверенные временем таблицы Excel c адресами (ИТ-консультанты раньше элегантно обозначали этот подход в своих презентациях как «бизнес-процесс поддерживается программным комплексом Excel»).
Для запуска же большой сети магазинов или массового приобретения с последующей продажей объектов недвижимости этого может быть недостаточно.
Новые регионы. Традиционно поиск областей для расширения розничного бизнеса представляет собой сложный процесс, который требует использовать так называемый «локальный опыт». Использование геоданных и аналитических инструментов Location Intelligence и GeoAI, даёт возможность искать новые локации для расширения сети без углубленного изучения новых регионов «на месте», большую часть работы проводить в формате «кабинетной оценки», не выезжая из офиса. Эта возможность востребована и у консультантов, задействованных в сделках M&A.
-
Все участники процесса в одном месте. Также заметным бонусом использования геоаналитических платформ является то, что весь сквозной бизнес-процесс (включая поиск, сбор и подготовку данных, визуализацию данных на карте, аналитику и моделирование, использование результатов анализа в последующих работах и процессах, подготовку отчётов для инвесторов и руководителей и тд,) выполняется на одной платформе, используемой всеми подразделениями компании и партнёрами.
Модели машинного обучения анализируют большие данные лучше, чем самые опытные специалисты, выполняют поиск в большем количестве наборов геоданных, используют больше переменных, чтобы обнаружить закономерности, обеспечивают более высокую скорость и точность.
В сочетании с возможностями интеграции внутренних данных компании с данными из различных внешних источников и использованию уже готовых отраслевых специализированных сервисов (например, поиск лучшей локации для стрит-ритейла, или прогнозирование выручки аптеки), современные технологии позволяют быстро масштабировать бизнес.
И что, кого-то это интересует?
Выбор оптимального месторасположения («Site Selection») востребован во многих отраслях.
Если говорить о ритейле, то это все те бизнес‑модели, где точек продаж много, а ключевые показатели бизнеса значительно зависят от того, где эти точки географически размещены. Это сетевые магазины, рестораны, кофейни и аптеки, операционные офисы крупных банков и банкоматы, пункты выдачи заказов, постаматы и вендинговые автоматы, распределительные центры, сетевые автозаправки (со временем и пункты зарядки электромобилей), торговые центры, парковки для самокатов и т. д..
При планировании открытия или закрытия, перемещения или консолидации точек продаж можно использовать уже готовые и протестированные в заданном городе модели и наборы данных.
Смежные с ритейлом специалисты из коммерческой недвижимости, инвестиционные фонды недвижимости, логистические компании тоже внимательно изучают возможности прогнозирования выручки, пешеходного и автомобильного трафика, стоимости аренды или покупки недвижимости на основании данных в контексте месторасположения того или иного объекта.
Для владельцев недвижимости и застройщиков, управляющих компаний важно иметь представление как о текущей рыночной стоимости всех объектов недвижимости, так и прогнозировать изменение стоимости с учётом планов строительства дорог, метро, комплексного развития территорий и многих других параметров.
Интерес к геопространственным сервисам подтверждается отчетами аналитиков. Также надежду на развитие рынка геопространственных технологий дает то наблюдение, что известные консалтинговые компании организовали у себя центры компетенции по геопространственной аналитике и стали использовать соответствующие инструменты и геоданные в своих проектах и исследованиях [3].
А кто у меня будет это делать?
При использовании специализированных геопростраственных решений и сервисов анализ геоданных выполняется без кодирования совсем (no-code) или с применением простой консоли с использованием команд SQL (low-code).
Для проведения анализа пользователю не нужно глубоко погружаться в знания в области GeoAI, или проходить курсы по программированию на Python. Сотрудник создает готовое решение, не программируя, а «собирая» его из готовых блоков.
Поэтому геоаналитиками могут стать сотрудники любого подразделения.
Существующие бизнес-аналитики и инвестиционные аналитики, маркетологи:
получают доступ к актуальным качественным геоданным (состав наборов данных зависит от задачи);
получают понятный инструмент для визуального определения плюсов и минусов определенных локаций (например, сколько покупателей живет на определенном расстоянии от конкретного магазина и сколько времени им требуется, чтобы дойти или доехать до него, сколько рядом пунктов выдачи wildberries или ozon и др., сколько рядом конкурентов, попадает ли объект недвижимости в определенную область покрытия и т. д.);
используют геоданные в качестве переменных для создания прогнозных моделей (например, для выручки в точке продаж в заданной локации, определения потребностей у клиентов будут в будущем, сколько будет стоить тот или иной объект недвижимости в этом месте, как именно влияет на продажи изменение того или иного критерия и т. д.);
быстро создают нужные отчёты и презентации для инвестиционных комитетов и акционеров, исследований в рамках маркетинговых стратегий и планов развития бизнеса.
Сотрудники и руководители бизнес‑ и операционных подразделений получают интерактивные карты и оперативную информацию по территориально‑распределенным бизнес‑процессам / своим подразделениям / точкам продаж, и могут принимать решения в контексте физического окружения.
Ответственные за развитие региональной сети или сети франчайзи сотрудники совместно работают с картами и объектами на них, быстро анализируют данные и согласуют размещение новых точек продаж с учётом расположения уже существующих, публикуют карты для доступа всех участников процесса, готовят отчёты.
Техническая поддержка геоаналитической платформы может осуществляться как обычно, как на стороне компании‑разработчика, так и на стороне ИТ‑подразделения компании‑заказчика, или гибридный вариант (например, первая линия поддержки — на стороне Заказчика, вторая и третья — выполняется компанией — разработчиком).
Формат методологической поддержки и консалтинга — тоже настраивается в зависимости от требований и бюджета.
Отраслевые решения для ритейла
Типовые кейсы применения геопространственного анализа для ритейла:
Выявление пространственных кластеров с высокими и низкими значениями исследуемых параметров (Hotspot Analysis)
Поиск областей‑двойников (Twin Area Analysis)
Моделирование выручки планируемого магазина с учётом его месторасположения и окружения (Revenue Prediction)
Расчёт коммерческой ёмкости месторасположения (White Space Analysis)
Зачем искать двойников
Область, в которой находится точка продаж, характеризуется набором определенных характеристик, например, пешая доступность, конкуренты по соседству и т. д. [6].
Если у компании уже есть несколько работающих точек продаж, и ясно, какие из них работают лучше остальных, то понятным желанием становится разместить новые точки в районах, максимально похожих на те, где работают лучшие.
Для этого нужно сравнить характеристики области, в которой размещен самый прибыльный магазин с характеристиками каждой исследуемой области, и выбрать наиболее похожие.
В этом и состоит метод поиска двойников территорий («Twin Area»).
Как мы применили метод Twin Area
Наша задача состоит в том, чтобы найти для открытия новых пунктов аренды оборудования для ремонта такие области, которые максимально похожи по набору параметров на те, где уже работают самые удачные пункты. В этом случае самыми удачными мы считаем точки с максимальной дневной выручкой.
Для этого применяем процедуру поиска двойников территорий. Работает она так:
Входными параметрами для поиска двойников является список магазинов сети с наиболее высокой выручкой. Для каждого магазина задан набор атрибутов (адрес, размер торговой площади и ряд других).
Результатом расчёта станут области, наиболее похожие на исходные по значениям заданного набора переменных.
Шаг 1 «Определение критериев для сравнения областей»
Выбираем параметры, по которым будем сравнивать области. Параметры зависят от бизнеса.
Мы руководствовались простыми соображениями:
чем ближе к местам проживания, тем лучше;
чем больше рядом точек притяжения «наших» клиентов, тем лучше (например, если кто‑то ходит пешком в пункт выдачи заказов WB или Ozon, то ему будет интересно по пути зайти и в наш пункт, или если он приехал на строительный рынок, то и к нам зайдёт) и т. д..
Критерии разделили на 4 направления:
Численность потенциальных покупателей
Транспортная доступность
Рыночный спрос
Конкуренты
Для расчета использовали открытые данные из публичных источников с учетом отраслевой специфики.
Шаг 2 «Построение «зон обслуживания» вокруг работающих точек продаж»
Для всех работающих магазинов строим «зоны обслуживания». Зоны обслуживания строим путем определения карты изохром — областей пешеходной или транспортной доступности от точки продаж во всех направлениях за заданный промежуток времени.
Для нашей задачи мы выбрали изохромы 20-ти минутной пешеходной доступности.
Шаг 3 «Разделение территории Москвы на одинаковые шестиугольники»
Процесс определения сетки необходим для того, чтобы иметь возможность сравнивать области одинакового размера.
Территория Москвы была разбита на гексагоны. Сетка построена с использованием пространственных индексов h3. Гексагоны h3 — это система геокодирования, которая делит поверхность Земли на равные шестиугольные ячейки.
В проекте использовались гексагоны h3 уровня вложенности 9, размер одной грани 173 метра, площадь — 0,1 км2. Всего таких гексагонов получилось ~10 000 шт.
Для снижения количества объектов для анализа в расчет были включены гексагоны, имеющие пересечения хотя бы с одним жилым или административным зданием.
Для каждого гексагона был построен изохром пешей доступности. Каждый изохром был обогащен данными.
Шаг 3 «Обогащение данных каждого исследуемого изохрома»
Для получения большей информации о локальном окружении каждого магазина, были собраны, очищены и обработаны следующие данные из открытых источников:
Остановки общественного транспорта, шт;
Вестибюли метрополитена, шт;
Ёмкость платных парковок, шт;
Торговые центры, м2;
Бизнес центры, м2;
Строительные рынки, шт;
Строительные моллы, шт;
Жилые здания, м2
Шаг 4 «Построение векторов для исходной и целевых изохром»
Обогащаем полученные изолинии теми значениями, которые мы рассчитали.
Рассчитываем значение в каждой области для каждого критерия. Например, сколько в исследуемую область «попало» пунктов выдачи заказов маркетплейсов, сколько квадратных метров торговых центров и т. д.
Получили данные для построения вектора характеристик существующих объектов, по которым мы и сможем сравнивать области.
Для каждой изолинии строим вектор из рассчитанных значений. Для этого дополняем каждую построенную область данными из внешних наборов геопространственных данных,
Шаг 5 «Исключение парных корреляций»
Чтобы модель была более точной, нужно исключить параметры, которые зависят друг от друга (т. н. парные корреляции).
Для этого строим матрицу корреляции Пирсона. Коэффициент корреляции Пирсона — это мера линейной связи между двумя переменными.
Обнаружена незначительная корреляция между показателями «Количество остановок», «Количество вестибюлей метро» и «Площадь жилых зданий».
Шаг 6 «Сравнение локаций путем расчёта косинусного расстояния»
Расчёт показателя сходства между исходным месторасположением и набором исследуемых областей будем проводить путём вычисления косинуса угла между вектором области, где размещен лучший магазин, и вектором каждой исследуемой области.
Из школьной тригонометрии помним, что косинус угла в 0 градусов равен единице, т. е., чем ближе к единице косинус, тем два вектора более похожи.
Рассчитываем косинусы углов между вектором исходной области и вектором каждой исследуемой области (далее будем называть это значение «коэффициент схожести»).
Те области, для которых коэффициент схожести близок к единице, и будут искомыми областями — двойниками.
Результаты процедуры поиска областей‑двойников для выбранного исходного местоположения представлены ниже:
На этой карте показан показатель сходства для всех исследуемых гексагонов с положительным результатом в Москве: более высокие оценки указывают на области, более похожие на исходное местоположение.
Заключение
Возросшая доступность больших геопространственных данных, развитие искусственного интеллекта и вычислительных мощностей создали импульс для использования геопространственных данных во всех отраслях.
Технологии искусственного интеллекта создают новые возможности для геопространственного анализа и прогнозирования.
На примере применения одного из нескольких типовых методов определения оптимального месторасположения (поиск областей‑двойников или Twin Area) мы видим, как технологии Location Intelligence и GeoAI могут использоваться в сетевом ритейле и управлении коммерческой недвижимостью, и стать широко используемым инструментом для развития бизнеса.
Термины и Определения (осторожно, есть buzzwords)
Геопространственный искусственный интеллект (GeoAI) — это дисциплина искусственного интеллекта, которая использует машинное обучение для извлечения знаний из пространственных данных.
Наука о пространственных данных (Spatial Data Science)‑ это развивающаяся область, ориентированная на методы обработки, управления, анализа и визуализации пространственных больших данных, предоставляющая возможности для получения динамической информации из сложных пространственных явлений.
Дистанционное зондирование Земли (далее — ДЗЗ) — это получение информации о поверхности Земли и объектах на ней бесконтактными методами, при которых регистрирующий прибор удалён от объекта исследований на значительное расстояние. Дистанционное зондирование Земли — это еще один способ получения пространственных данных, например, с изображений со спутниковых датчиков.
Литература
Gravity and Spatial Interaction Models, Kingsley E. Haynes, A. Stewart Fotheringham, 1985 г. https://researchrepository.wvu.edu/rri-web-book/16/,
Spatial interaction modeling using artificial neural networks, Author: William R Black, Journal of Transport Geography, September 1995, Spatial interaction modeling using artificial neural networks - ScienceDirect
PwC Middle East Location Intelligence Services, https://www.pwc.com/m1/en/services/deals/pwc-middle-east-location-intelligence-services.html,
Future Trends in geospatial information management: the five to ten year vision – THIRD EDITION, Global Geospatial Information Management August 2022 (Microsoft Word - CONSULTATION DRAFT_Future Trends_v1.0 (un.org))
What is AI GIS (Artificial Intelligence GIS)? February, 2020 https://www.supermap.com/en-us/news/?82_2701.html
Как выбрать удачную локацию для торгового помещения?, Руслан Сухий, август 2020 г. https://vc.ru/trade/153446-kak-vybrat-udachnuyu-lokaciyu-dlya-torgovogo-pomeshcheniya?ysclid=ldlmjqsniu238907859
Sources of VGI for Mapping Linda See, Jacinto Estima , Andrea Pődör, Jamal Jokar Arsanjani, Juan-Carlos Laso Bayas, and Rumiana Vatseva
Ритейл возглавил рейтинг сфер-лидеров по цифровизации в России, https://new-retail.ru/novosti/retail/riteyl_vozglavil_reyting_sfer_liderov_po_tsifrovizatsii_v_rossii2835/
«Как беспилотники оцифровывают поля» https://vc.ru/u/1324628-leader-id/527541-kak-bespilotniki-ocifrovyvayut-polya
psionik
добрый день, подскажите пожалуйста клиентов вашей компании - какие у них результаты в этих точках при использовании только вашего софта? и есть ли у вас в команде кто нибудь с точки зрения работы в реальном бизнесе, поиска и открытии каких либо точек продаж (какой-нибудь Директор развития из реального бизнеса)? я правильно понял что вы предлагаете какое то решение по геопозицианированию какой либо точки продажи?