Направление «Location Intelligence» не назовешь новым или инновационным. Технология появилась на кривой «Gartner Hype Cycle of Emerging Technologies» в далёком 2013-м году. Его старшие родственники BI и геоинформационные системы (ГИСы) тоже широко используются уже не первый десяток лет. В военно-промышленном комплексе технологии LI активно использовались и того раньше.

При этом востребованность и сфера применения LI с каждым завидной динамикой растут. Сегодняшние конференции по большим данным и искусственному интеллекту редко обходятся без выступлений на тему геоаналитики, геофенсинга, геолокационного маркетинга и других технологий, название которых начинается с «гео».

Компании воодушевленно делятся успешным опытом определения оптимального месторасположения точек продаж, рассылки уведомлений клиентам, находящимся рядом с определенной локацией, хитроумного планирования помещений внутри магазинов с учетом знаний о поведении покупателей (да-да, наше с Вами поведение – объект нешуточных исследований), рассказывают о результатах анализа продаж по геопризнаку на основании чеков, решении логистических и других задач, нацеленных на повышение эффективности рекламы и улучшение клиентского опыта. Фонды недвижимости и того активнее размышляют на темы оценки недвижимости и best-use анализа активов с учетом сегодняшних возможностей Data Science и Machine Learning (далее - ML).

Маркетинговая погоня за нашими кошельками ­ только один небольшой пример применения LI.

За последние 7 - 10 лет эффективность применения LI серьёзно увеличилась благодаря трём основным причинам:

  1. росту количества источников данных. Объем ежедневно генерируемых в мире данных с привязкой к географическому месторасположению, потрясает воображение и уверенно позволяет назвать их BIG DATA (BIG GEO DATA или BIG SPATIAL DATA, одного чёткого определения, как водится, пока не удалось найти), и работать с ними по всем суровым законам Data Science. Это и сенсоры и датчики IoT, "умные города" и "умные дома", автомобили, мобильные устройства со встроенными GPS-приёмниками, онлайн-кассы, социальные сети, платежные системы, данные с видеокамер и другие.

  2. активному развитию смежных комплиментарных направлений и технологий – BIG DATA, пространственного анализа, технологий идентификации и позиционирования и LIDAR-сканирования, а также использованию моделей ML и Data Science для извлечения, очистки, обогащения и анализа данных из самых разных источников, состав и разнообразие которых может удивить даже самого искушенного учёного, маркетолога, или писателя-фантаста.

  3. популяризации математики и Data Science, и возникновение плеяды профессионалов, способных совместно с экспертами из разных отраслей реализовать весь цикл сбора и анализа датасетов из множества источников, а также аналитической визуализации и интерпретации данных.

Эти причины привели к тому, что LI стала использоваться для изучения поведения людей, выявлять пространственно-временные факторы среды, которые влияют на это поведение, а также взаимодействовать с потенциальными и действующими клиентами, конкурентами и поставщиками в контексте физического окружения.

В основе LI лежат:

  1. идентификация физического месторасположения по географическим широте и долготе (точность позиционирования - интересная тема для дополнительного обзора),

  2. возможность объединения на цифровой карте данных из разнообразных источников о физических объектах, компонентах окружающей среды, городской и промышленной инфраструктуры, людях и их перемещениях, событиях и даже постов в социальных сетях.

  3. анализ данных из разных источников в контексте месторасположения в комплексе, учитывая их влияние друг на друга.

Платформы и инструменты LI успешно применяются для научных исследований, развития и функционирования городских транспортных систем и градостроительного планирования, решения задач урбанистики, охраны окружающей среды, устранения последствий природных катаклизмов и катастроф, работу органов муниципального и государственного управления. Активными бизнес-пользователями технологии являются также ИТ-гиганты (Google, Amazon, Facebook, Apple, Яндекс и т.д.), телеком-операторы, сетевые ритейлеры и логистические компании м так далее.

LI уверенно встраиваются и во все остальные сферы деятельности, а также становятся драйвером создания новых бизнес-моделей. Например, ставшая при жизни хрестоматийной бизнес-модель Uber, в которой данные о месторасположении и позиционирование используются для подбора исполнителей заявок, построения оптимального маршрута, определения времени и стоимости поездки, а собираемые всеми автомобилями данные используются для анализа пробок, прогнозирования ограничений и оценки влияния определенных событий на движение в городе, или сервисы курьерской доставки Postmates и DostaVista, и другие модели.

По Москве бодро колесят беспилотники (пока в тестовом режиме) и роботы-доставщики еды Яндекса (уже в пилотном режиме), по полям США катается и собирает большие данные для сельского хозяйства робот Alphabet Mineral, дроны фотографируют львов в саваннах для последующего анализа данных об изменении численности и плотности популяции, - в развитии подобных инновационных решений важным компонентом является LI.

Источники данных для LI

В дополнение к традиционным источникам данных, достижения четвертой промышленной революции позволили использовать также данные из следующих источников:

  1. IoT и мобильные устройства. Сенсоры и датчики IoT и мобильные устройства генерируют огромные массивы данных с привязкой к географическому месторасположению.

    Например, сбор данных можно организовать силами пользователей мобильных приложений с использованием функции геопозиционирования или локального позиционирования. Таким образом отзывы и другие данные о местах посещения пользователей собирают социальные сети, платформы FourSquare (мобильное приложение для чекинов Swarm), TripAdvisor, Yelp и другие.

  2. Фотоснимки высокой точности поверхности Земли со спутников, самолетов, дронов и других. Современные технологии Deep Learning позволяют, например, выделить на снимке автомобили или парковочные места, или найти все пальмы, дороги, здания нужного типа в заданном регионе и так далее, и подготовить данные для анализа на LI-платформе.

    Сформировался и развивается рынок сервисов для решения подобных задач идентификации и классификации нужных объектов на снимках поверхности Земли. Есть компании, которые производят съемку, обрабатывают снимки, извлекают из них различные данные (в том числе, с использованием Deep Learning), а также поддерживают весь жизненный цикл данных. Появляются также облачные платформы, предоставляющие сложные сервисы спутникового мониторинга на условиях подписки.

    Снимки можно как приобретать у коммерчески игроков, так и использовать открытые ресурсы, например, OpenAreialMap и подобные.

  3. Внешние датасеты. Анализ больших данных постепенно становится доступным не только ИТ-гигантам и корпорациям, но и самым разным компаниям крупного, среднего и даже малого бизнеса. Многие компании давно предоставляют бесплатно или продают доступ к данным для анализа и использования в различных приложениях и системах как государственным (транспортным, дорожным, коммунальным и другим службам), так и коммерческим организациям от корпораций до стартапов

    Открытые данные и API. Интересные для анализа наборы данных, в том числе с привязкой к географическому месторасположению, публикуются на открытых ресурсах в рамках реализации концепции открытых данных. В открытом доступе во всем мире размещаются наборы данных, полученные в результате научных исследований, а также данные государственных и других компаний, геологических, метеорологических и многих других служб. В качестве интересного примера можно привести наборы данных Environment Agency Великобритании, собранные в ходе LIDAR-сканирования. Они содержат в том числе характеристики холмов, рек и долин в заданных областях, и могут быть использованы для прогнозирования наводнений и расчёта страховых взносов. Наборы данных размещены на федеральном портале открытых данных Великобритании (data.gov.uk/dataset/) и доступны для всех.

    Тенденция демократизации знаний постепенно докатилась даже до моделей машинного обучения. Например, в открытом доступе можно найти уже обученные нейросети, которые умеют распознавать снимки поверхности Земли и идентифицировать на них заданные объекты. Появляются open source ресурсы, на которых разработчики размещают модели машинного обучения для доработки или переиспользования.

    Приобретение данных. Приобретать доступ к данным (через API или SDK) и/или отчеты и выгрузки данных можно у коммерческих игроков (например, Google Maps, Airbus, Yelp, TripAdvisor, Foursquare, 2ГИС, телеком-операторов, платежных систем и так далее), постепенно появляются и становятся доступными сервисы провайдеров больших данных с привязкой к месторасположению (например, «Платформа больших данных» ВТБ и Ростелекома, «МТС-Маркетолог», «Первый ОФД» и подобные).

  4. Краудсорсинг сбора и обработки данных. Для сбора данных можно использовать цифровые платформы краудсорсинга, где на основании размещенного задания пользователи сделают фотографии или нужные измерения в заданных локациях и сохранят данные в специализированных мобильных приложениях или заданном формате. Таким же образом можно организовать работу по разметке для последующего обучения нейросетей. Примеры таких платформ - Amazon Mechanical Turk, Яндекс.Толока, YouDo и другие.

Заключение

Благодаря современным возможностям геопозиционирования у больших данных появился новый компонент – географическое месторасположение. Этот компонент становится связующим звеном между цифровой деятельностью и физическим миром.

Использование LI обеспечивает возможность сбора, интеграции и анализа больших данных из разнородных источников, мониторинга и контроля событий и процессов, организации взаимодействия в контексте физического окружения, а также возможность организации удобного интерфейса между человеком и роботом.

LI обладает большим потенциалом в части объединения достижений разных современных технологий, и её использование становится необходимой составляющей для цифровой трансформации многих отраслей.

 *Данная статья отражает применение и развитие LI гражданском секторе промышленности, хотя, как и для многих других технологий, основными драйверами развития этой концепции является решение задач военно-промышленного сектора. Задачи военных, которые решаются с использованием LI (из открытых источников, конечно), будут отражены в других обзорах.

Список использованных материалов:

  1. Location Intelligence for Real Estate

  2. Data Driven Retail: Extracting Value From Customer Data

  3. How Location Intelligence Is Powering Today’s Most Disruptive Products