Привет, Хабр! Меня зовут Алексей Алексеев, я руковожу геоаналитическими сервисами в Platforma. И сегодня я хочу рассказать вам, как мы разрабатываем и внедряем инструмент аналитики для бизнеса на базе больших данных, с помощью которого предприниматель способен за полчаса выбрать идеальную точку для открытия бизнеса в конкретном городе.

Оглавление

  1. Геоанализ меняет правила бизнеса

  2. Откуда данные и как с ними работать?

  3. Модель гармоничного развития территорий и решение задач бизнеса

Все дело в аналитике геоданных. Благодаря ей бизнес получает максимально точную и свежую информацию об аудитории и может снизить инвестиционные риски минимум в два раза. А чтобы использовать инструмент, не нужно особых знаний или умений. Мы все уже сделали заранее. Рассказываю, как все это работает.

Геоанализ меняет правила бизнеса

Чтобы открыть локальный бизнес, предпринимателю нужно понимать уровень потенциального спроса на его услуги или товары в конкретной точке. Можно вложить миллионы, сделать шикарный сервис, но разориться через пару месяцев, потому что в локации просто нет целевой аудитории.

Раньше эту задачу решали примитивными способами. Предприниматель выбирал несколько локаций, которые казались ему перспективными. Затем он сам или специально нанятые люди просто наблюдали за прохожими, анализировали в ручном режиме застройку и заведения, которые там уже есть. Много данных так не соберешь, но кое-какие выводы сделать можно.

Сложность в том, что инвестиционные риски при таком анализе очень высокие. Ведь проходимость точки может быть отличная, но целевой аудитории в ней будет минимум. Открытие бизнеса превращается в лотерею: повезет или нет.

Анализ геоданных полностью меняет правила игры. С его помощью можно:

  • точно оценить объемы и платежеспособность целевой аудитории, заинтересованной в конкретных товарах или услугах;

  • проанализировать график спроса-предложения в локации;

  • проверить насыщенность конкурентной среды;

  • отследить наличие и стоимость свободных площадей, доступных для открытия бизнеса.

Для предпринимателей это возможность снизить риск ошибки при открытии бизнеса в десятки раз. А стоимость использования сервиса составляет меньше 1% операционных рисков. Это классическая win-win стратегия.

Откуда данные и как с ними работать?

Что такое геоданные? Если обобщить, то это массивы информации, привязанные к конкретной локации населенного пункта. Они помогают узнать характеристики аудитории, которая характерна для определенной локации, а также ее поведенческие паттерны и интересы. 

Сейчас для идентификации мы работаем с квадратами 500х500 метров, размеченными в рамках городов. И каждая единица геоданных привязана к своему квадрату.

Сразу скажем: схема не идеальная. Для районов с очень плотной застройкой квадрат 500х500 дает некоторую долю погрешности. Все дело в стандартизированных паттернах геоданных, которые телеком-операторы собирают именно в такие квадраты. 

В будущем мы планируем постепенно переходить на непрерывную схему анализа, привязанную к точкам, а не к квадратам. Но это долгая история.

Сами источники геоданных могут быть разными: в основном мы используем данные, полученные от телеком-операторов, банка и бюро кредитных историй. 

Важный момент. Контрагенты отправляют сервису уже анонимизированные данные, поэтому вопрос утечки персональной информации решается еще до того, как мы начинаем анализ. 

Любителям теории заговора: данные GPS-трекеров в смартфонах использовать в теории тоже можно, но смысла в этом мало. Обычный человек и так оставляет несколько десятков геоследов за день. 

Когда вы расплачиваетесь в магазине или кафе картой, серфите в интернете, делаете онлайн-покупку или заказываете доставку — каждое такое действие конвертируется в геоданные. 

Уже сейчас мы только с помощью анализа банковских операций собираем данные по 700–800 атрибутам, в зависимости от города. К примеру, чеки покупок в кафе можно сгруппировать по количеству, средней сумме или среднему размеру для для каждого квадрата в городе. 

Каждый атрибут — это отдельный слой для визуализации на карте. Комбинируя их по различным параметрам, можно строить математические модели с разными целями. В среднем, для создания математической модели анализа используются около 10 атрибутов. 

Примерно в 85% случаев предприниматели хотят узнать, выгодно ли в конкретной точке открывать бизнес или нет.

Касательно посещений веб-сайтов, то количество категорий интересов, которые мы анализируем, составляет около 2000. Здесь мы используем систему на основе машинного обучения, которая позволяет определить, к какой теме или плеяде тем относится конкретный сайт и какие интересы аудитории означает его посещение.

Простой пример: если кто-то часто посещает автомобильные форумы и онлайн-магазины запчастей, то скорее всего у него есть свой собственный автомобиль  и он входит в круг его интересов. Из истории браузера в сотню вкладок мы уже можем достаточно четко определить интересы пользователя, которые дальше используем в аналитике. При этом для системы это будет просто юзер Х, проживающий или работающий в таком-то районе, а как его зовут мы никогда и не узнаем.

Модель гармоничного развития территорий и решение задач бизнеса

Геоплатформа позволяет решать самые разные задачи крупного и малого бизнеса. Приведу несколько популярных задач, которые пользователи решают с помощью геоданных.

Наиболее распространенный пример бизнес-кейсов — открытие кофейни. Для этого нужно проанализировать спрос и предложение на конкретную услугу.

Предприниматель планирует открыть заведение и ищет локацию с высокой проходимостью. Но при этом он хочет, чтобы среди жителей локации, сотрудников офисов и просто прохожих было достаточно любителей кофе, которые покупают его навынос. 

Можно выбрать несколько перспективных локаций. Дальше в дело вступает геоанализ.

  1. Определяем аудиторию. Для этого запускаем слой с целевой аудиторией 20-45 лет по месту проживания со средним и выше доходом. Этот слой у нас розовый.

  1. Определяем предложение. Данные фискальных операций покажут, в каких квадратах было проведено больше всего транзакций, где в списке покупок есть кофе. Показано голубым.

  1. Находим точки. Осталось выбрать конкретный квадрат, в котором факторы сочетаются лучше всего. Сделать это можно либо визуально, либо с помощью инструментов платформы, которая серым цветом подсветит квадраты с нужным сочетанием факторов.

В результате на такой карте мы можем легко определить локации, где спрос на кофе высокий, а предложения недостаточно. Они и будут наиболее перспективными с точки зрения окупаемости и доходности бизнеса.

При этом мы понимаем, что нашими услугами пользуются и малые предприниматели, у которых нет аналитиков в штате. Без грамотной аналитики отдельные геослои будут очень ограничено полезны. 

Поэтому для распространенных задач мы создали уже проанализированные «рецепты». Это пакеты геослоев до 10 штук, которые решают распространенные задачи бизнеса в конкретном городе с прямым ответом на поставленный вопрос. 

Если бизнесмен ищет, где открыть салон красоты в Санкт-Петербурге, он получит «рецепт», состоящий из восьми геослоев, в которых он увидит распределение целевой аудитории по квадратах, средние чеки пользователей на аналогичные услуги и их количество, насыщенность квадрата конкурентами, наличие и стоимость свободных площадей под открытие бизнеса. При этом наши аналитики сделают выводы и отдельно укажут наиболее перспективные локации в городе для нового салона красоты. 

Предпринимателю не нужно делать ничего — он сразу получает ответ на свой вопрос.

Вот как выглядит готовый рецепт для кофеен в Новосибирске.
Вот как выглядит готовый рецепт для кофеен в Новосибирске.

Поиск локации для бизнеса или анализ целевой аудитории, которая проходит через конкретную точку в городе — лишь вершина айсберга задач, для решения которых можно использовать анализ геоданных.

На основе анализа big data мы разработали модель гармоничного развития территорий. Это гипотетический город, в котором наилучшим образом расположены локальные бизнесы, элементы инфраструктуры и государственные учреждения. Другими словами, в этом городе идеален баланс спроса и предложения всех необходимых услуг.

А затем, сравнивая конкретный квадрат города с его «идеальным» аналогом, мы можем понять, каких бизнесов и учреждений здесь недостаточно. Такой обратный анализ поможет, если предприниматель хочет открыть дело в конкретном здании. К примеру, в новом ЖК, который только планируют сдавать в эксплуатацию. И ему нужно узнать, какой именно бизнес будет здесь максимально доходным.

Или, к примеру, еще одна задача. Допустим, у предпринимателя уже есть успешный бизнес в конкретной локации, но недалеко от нее строят новый торговый центр. И он хочет узнать, как он повлияет на доходность дела. Стоит ли оставаться в этой точке, заранее арендовать площадь в ТЦ или переезжать куда-нибудь в другое место. 

Мы просто запускаем анализ геослоев и добавляем на эту точку торговый центр и бизнесы, которые в нем будут в перспективе расположены. А затем сравниваем величины. Торговый центр недостроен, а мы уже можем оценить его влияние на бизнес. При этом предприниматель может сразу запустить анализ, как ему можно изменить ассортимент товаров и услуг, чтобы компенсировать будущую конкуренцию.

***

Анализ геослоев позволяет предпринимателям быть на шаг впереди и подготовиться к вызовам и сложностям задолго до того, как они начнут ощутимо влиять на бизнес.

По сути предприниматель может использовать готовые выводы, которые сделали наши эксперты, или выбрать любые из почти 3000 доступных геослоев самостоятельно, чтобы запустить анализ данных силами собственных аналитиков.

Сейчас проект работает только с собственными данными. Но в ближайшие полгода мы планируем запустить его как маркетплейс, куда любая компания сможет загружать собственные агрегированные данные и получать прибыль, когда их кто-то использует. В перспективе это еще больше улучшит точность сделанных прогнозов и привлечет больше клиентов.

И мы надеемся, что уже через год анализ геоданных превратится из диковинного инструмента в must have для любого бизнеса.

Комментарии (6)


  1. Aknodx
    10.11.2022 12:17

    Интересная статья и интересный инструмент! Можно сказать, что по жизни я занимаюсь программными средствами так или иначе связанными с анализом и принятием решений, включая системы поддержки принятия решений (включая пространственные решения по земплепользованию, ликвидации последствий загрязнений, использованию и обслуживанию инфраструктуры и т.д.), средствами для сбора данных для таких решений, средствами для оценки рисков и т.д.
    Интересно видеть простой в использовании инструмент для поддержки принятия бизнес решений, который может быть использован конечными пользователями сразу из коробки. Обычно, использование систем поддержки принятия пространственных решений это приручение целого зоопарка различных источников пространственных данных (разные форматы файлов, разные сервисы и т.д.), танцев вокруг обработки таких данных (преобразование форматов, вычисление расстояний, буферных зон и т.д.), построения моделей для анализа решений на основе обработанных данных с учетом различных факторов, работа с экспертами, заинтересованными лицами, лицами принимающими решения и т.д.
    Может ли ваш инструмент (в текущей реализации или перспективе) помочь в выборе места расположения кафе из числа конкретных мест заданных пользователем? Можно ли учитывать пользовательские данные (стоимость, площадь, состояние помещения и т.д.)? Можно ли учитывать приоритеты пользователей (минимальные вложения, максимальная прибыль, минимальные риски и т.д.)? Может ли ваш инструмент помочь в решении задачи использования определенного места (что построить, кафе, магазин, заправку и т.д.)?


    1. Alekseyalekseyev Автор
      11.11.2022 15:59

      Спасибо за комментарий.
      Вы совершенно правы, мы стараемся взять на себя львиную долю задач пользователя.

      Это, прежде всего, работа дата-инженеров по сбору данных из разных источников, приведение их в единый формат и к единому виду. Затем в дело вступают наши дата-сайентисты и строят модели, учитывают буферные зоны, выделяют максимально влияющие факторы, и создают геослои для решения конкретных задач.

      Например, мы предлагаем предрасчитанные геослои для 35 отраслей (есть и кафе), которые позволят сравнить несколько точек между собой с позиции ожидаемой успешности. Совсем скоро пользователь сможет загружать свои данные и использовать их при сравнении.

      Мы думаем над тем, как предлагать требующие постоянного обновления данные: к примеру, доступность свободной коммерческой недвижимости или среднюю стоимость аренды.

      Мы работаем над моделями, которые для одной локации предскажут успешность разных бизнесов. Словом, мы в самом начале большого пути. Будем рады видеть вас в нашей команде.


  1. mentin
    10.11.2022 22:51
    +1

    Для предпринимателей это возможность снизить риск ошибки при открытии бизнеса в десятки раз.

    Каждый раз читая такое, хочется спросить, есть ли данные подтверждающие эти "десятки раз"? Не рассказ про то какие данные пользователю предоставляют, а статистика успеха, скажем без данных Х% кафешек закрывается в течение первого года, а с нашими данными только У%.

    Не рассматривайте как критику конкретно геоплатформы, это просто общая проблема в консалтинге - все готовы описать тонну процессов, "помогающих" бизнесу, практически никто не измеряет их реальную эффективность. Иногда конечно потому что она отрицательна, но и когда она скорее присутствует, никто не измеряет, поэтому все эти заявления о снижении риска остаются словами.


    1. Aknodx
      11.11.2022 11:14
      +1

      На мой взгляд, подобные заявления о снижении рисков, увеличении прибыли и т.д., это не более чем маркетинг. Безусловно, можно оценить эффект от внедрения и использования определенной методики или информационной системы на производстве посредством сравнения конкретных показателей производства до и после внедрения. Но, когда речь заходит об использовании методов и средств поддержки принятия решений то сравнивать не с чем. Точнее, можно сравнивать возможные варианты действия (возможные места расположение кафе) друг с другом, можно вводить идеальные варианты и сравнивать имеющиеся варианты с ними, можно оценивать насколько выбранный вариант (с учетом многих критериев, неопределенностей, точек зрения) лучше случайного выбора. Но, все эти сравнения лежат в плоскости модели решения, которая построена исходя из имеющихся знаний и опыта, текущей или прогнозируемой ситуации, учитывает определенные факторы и риски и имеет множество ограничений. Другими словами, лучшее место для кафе (с точки зрения рекомендаций некоторой системы) может легко оказаться худшим потому что не были учтены изменения в экономике и бизнесе, не были учтены приоритеты и предпочтения местных жителей и владельца нового кафе, данное место (район) было рекомендовано еще пяти бизнесменам, которые также решили открыть там свои новые кафе.


      1. mentin
        11.11.2022 12:24

        Вот вот! И когда этот маркетинг про "снижение рисков в десятки раз" в рекламных материалах для лохов покупателей - это ожидаемо. А в статье на Хабре для людей занятых обработкой данных, и всегда задумывающихся - откуда это утверждение, что за ним стоит? - лучше это упустить.


  1. exfizik
    10.11.2022 23:42

    Интересно было бы про технологии почитать.