На Хабре время от времени появляются статьи про различные веб-сервисы и приложения, так или иначе анализирующие городскую среду. Такие сервисы, по задумке авторов, должны помогать жителям принимать какие-то решения - куда пойти, где купить жилье, где комфортнее жить и гулять. Из последних примеров:

Типичная идея таких сервисов - "а давайте возьмем городские данные, засунем в какой-нибудь ML алгоритм, что-то подсчитаем и красиво нарисуем на карте".

Часто все выглядит именно так - берем OpenStreetMap и пытаемся что-то с ним делать
Часто все выглядит именно так - берем OpenStreetMap и пытаемся что-то с ним делать

Однако результат часто оказывается "пальцем в небо". В комментариях же пользователи начинают просить добавить все новые и новые фичи и факторы, влияющие на качество среды. Как правило упоминают общественный транспорт, экологию, освещение улиц, плотность коммерческих объектов, загруженность социальной инфраструктуры. На что авторам приходится растерянно разводить руками и отвечать, что "ну если вы нам данные дадите, то мы их прикрутим". А данных-то и нет. И самый лучший алгоритм тут не поможет, если ему не дать качественные данные для работы.

Лицензии и доступность данных

Сразу стоит понять, для каких целей вы делаете свой сервис. Как правило, их делают либо с научно-просветительской целью, либо с коммерческой.

В первом случае вы решаете какую-то интересную задачку на анализ данных, и просто делитесь результатами с сообществом, бесплатно и открыто. Во втором случае вы планируете в будущем как-либо монетизировать свой сервис.

Многие корпорации, владеющие полезной для вас информацией, запрещают ее использование в коммерческих целях. При этом на научные публикации и исследования как-то закрывают глаза, но вот мимо коммерческого проекта, который делает деньги на их информации, они вряд ли пройдут.

Вот пример из соглашения на использование API TripAdvisor. В нем сказано, что вы не должны никак кешировать и сохранять данные от их API для создания своей собственной базы данных коммерческих организаций:

То есть, например, вы не имеете права скачивать из TA информацию о кафе и ресторанах, чтобы затем встроить ее в свой алгоритм подсчета притягательности территории для туристов. Информация вся есть, вот она, гигабайты ее. Но использовать ее нельзя по сути ни для чего, кроме как для простого отображения меток на карте.

Аналогичные ограничения есть практически у всех крупных сайтов, посвященных коммерческим объектам.

Поэтому внимательно изучайте лицензионные соглашения тех сервисов, данные с которых вы хотите использовать, иначе можете нарваться на неприятности.

В итоге по доступности информацию можно условно разделить на:

  • Общедоступные открытые данные - то что легко технически доступно (через API или можно просто скачать датасет себе), при этом вы имеете право это свободно использовать, в том числе в коммерческих целях.

  • Условно-доступные данные - то что технически скачать можно (спарсить с сайта, использовать торчащее наружу приватное API), но использовать можно либо с ограничениями, либо вообще формально нельзя, но тут может сработать принцип неуловимого Джо.

  • Закрытые данные - данные, которых нет в интернете, но их можно получить через соответствующие связи, либо купить.

Ниже я приведу список того, с чем сталкивался и работал лично в своих различных проектах в Институте дизайна и урбанистики ИТМО. Список не исчерпывающий, возможно в комментариях кто-то сможет дополнить, особенно в разделе про закрытые данные.


Общедоступные открытые данные

Карты

Для любой ГИС обычно нужна какая-то карта. Как в смысле картографической подложки, поверх которой можно рисовать какие-то свои данные, так и в смысле источника этих данных - координат и геометрии дорог, домов, рек, озер, лесов и прочих объектов.

Выбор подложек велик - тут и Яндекс, и Гугл, и OSM, и Here Maps, и MapBox и куча всего еще. Выбирают обычно чисто из эстетических соображений + полноты данных в том регионе, что вам нужен. Но есть некоторые подводные камни:

  • Выбор подложки зачастую привязывает вас к экосистеме этого провайдера, так как у многих провайдеров (Яндекс, Гугл, Here) есть ограничения на другие виды данных, что отображать их можно только на их же подложке. То есть если вы хотите использовать геокодер Яндекса - вы без вариантов должны использовать и картографическую подложку Яндекса.

  • У того же Яндекса есть ограничения на бесплатное использование - только для открытых проектов. Если в вашем проекте сложная закрытая регистрация или платный функционал - вы обязаны купить у них лицензию, бесплатно их сервисами пользоваться нельзя. Возможно что-то аналогичное есть и у других, надо изучать.

OpenStreetMap

Великий и ужасный OpenStreetMap - Википедия в мире карт, проект наполняемый самими участниками - по сути является единственным открытым источником картографических данных (а не только растровых изображений). Если вам нужны не картинки, а сами координаты домов, улиц и прочих объектов - вам сюда.

Вы можете скачать дамп целого региона или планеты в архиве, либо получать нужную вам область в виде API

Главный плюс OSM - там есть данные, которых больше нет нигде, и достаточно открытая лицензия.

Точки, линии, полигоны, отношения и теги - все есть, все можно скачать
Точки, линии, полигоны, отношения и теги - все есть, все можно скачать

Главный минус - детализация очень сильно плавает от города к городу. Где-то (где видимо нашелся маппер-энтузиаст) качество OSM бьет всех конкурентов, там будет размечено вообще все, вплоть до мусорных урн и отдельных деревьев. А где-то не будет ничего кроме пары главных улиц, кое-как перерисованных со спутника.

Есть еще ряд подводных камней, с которыми вы столкнетесь работая с OSM, и которые надо иметь в виду:

  • Ограничения на доступ и нагрузку. OSM - бесплатный проект от сообщества, поддерживаемый на пожертвования и живущий на энтузиазме. И они очень плохо относятся к тем, кто злоупотребляет халявой и создает излишнюю нагрузку на их API. Попытка выкачивать большие регионы или запрашивать очень много тайлов легко может привести к бану. На все претензии ответ будет один - "поднимайте свой инстанс и делайте с ним что хотите, а общественный бесплатный не насилуйте".
    Сюда же идут сложности с оффлайн-использованием. Если вы захотите сделать приложение с возможностью качать карты в оффлайн, вам придется скорее всего поднимать свой сервер. Так как выкачать все тайлы для всех уровней зума даже для небольшой территории - это очень много запросов.

  • Плохой геокодер. Честно, Nominatim - полная фигня. Отчасти это связано с плохой наполненностью базы адресами (впрочем опять же, зависит от города), но он и сам по себе просто тупой. После Яндекса пользоваться им невозможно, тупит и не угадывает, срабатывает только если идеально точно прописать адрес. Плюс еще и не больше одного запроса в секунду, иначе банит.

  • Вы никогда заранее не будете знать, насколько хороши данные OSM в нужном вам регионе (если только сами там не живете и не можете глазами сравнить карту и реальность). Пользователи будут постоянно вас ругать за то, что ваш сервис не учитывает вот этот дом и вот этот парк, а их на карте просто не разметили.

  • Многообразие способов описания одного и того же. Например, зеленая область на карте может быть отмечена и как лужайка, и как парк, и как лес (да, не удивляйтесь если у вас будет лес в центре города) и как огород и как черт знает что еще. Вы будете постоянно сталкиваться с тем, что ваши выбранные теги не включают в себя какие-то важные частные случаи, и вам придется их дополнять.

    На этом участке карты есть четыре разных вида разметки зелени
    На этом участке карты есть четыре разных вида разметки зелени
  • Данные бывают устаревшими. Опять же, все зависит от энтузиазма мапперов. По ощущениям, наиболее устаревшие данные - это коммерческие точки (кафе-магазины), на них в OSM полагаться нельзя вообще. Так как заведения открываются-закрываются часто, а править их всем лень, это не такая интересная работа, как разметка больших участков карты, дорог и кварталов.

    Этот Суши-Шоп закрылся уже больше года назад. При этом рядом с тех пор открылось еще 2-3 заведения, которых на карте нет
    Этот Суши-Шоп закрылся уже больше года назад. При этом рядом с тех пор открылось еще 2-3 заведения, которых на карте нет
  • Нет вообще никаких общих конвенций по маппингу. Зачастую в одном регионе местным сообществом принято одно, а в соседнем такие же объекты будут маппиться совсем иначе. Например, где-то встречал срач, что в Питере есть какие-то мапперы, которые принципиально рисуют все проспекты двумя отдельными односторонними линиями, и откатывают правки тех, кто с ними не согласен (рисует улицу одной двухсторонней линией). И фиг с ними что сделаешь.

  • Фундаментальная проблема любых карт (не только OSM), недавно поднятая, например, в комментариях к этому посту. Люди жалуются, что Яндекс их ведет по каким-то разбитым дорогам, вместо хороших новых улиц.
    Проблема в том, что в картах довольно ограниченное количество вариантов отображения объектов. И для тех же дорог есть дай бог штук 10 различных вариантов (в OSM это всякие теги primary-secondary-service-residential и еще ряд других), которые просто никак не могут покрыть все разнообразие всех возможных видов покрытия и состояния проезжей части.
    Более того, типы обычно назначаются согласно юридическому статусу дороги, а не ее физическому состоянию
    Вот пример двух улиц, обе имеют тег highway=residential, то есть местная улица в жилой застройке. Первая - асфальт, освещение, четыре полосы, карманы для автобусов. Вторая - какая-то разбитая грунтовка на задворках.

    Ну и как ваш бедный A* в навигаторе должен отличить одно от другого и понять, по какой из них вас надо вести? Да, иногда какие-то выводы можно сделать по дополнительным тегам (числу полос, покрытию, наличию освещенности), но они есть далеко не всегда и не везде. Можно придумывать всякие эвристики, типа "если на дороге есть маршрут ОТ - эта дорога предпочтительнее", но любые эвристики могут ошибиться.
    И попробуйте потом все эти сложности объяснить разозленным пользователям, у которых на проложенном вами маршруте колесо в яме оторвало.

Несмотря на все свои недостатки, OSM - потрясающий проект, не имеющий аналогов, и как правило служит базой для всех урбанистически-картографических исследований.

Важный бонус - работая с OSM вы получаете сразу огромный набор готовых инструментов по хранению, обработке данных, навигации, отображению и т.п. Например, для Java есть Graphopper - готовый набор из сервера и библиотеки для поиска путей, который из коробки умеет читать OSM-ные дампы и строить по ним быструю навигацию.

Вы всегда сможете ответить на все претензии пользователей в духе: "хотите что-то добавить - нарисуйте в OSM, заодно поможете всем другим проектам и навигаторам, которые его используют".

Рельеф

Данные о рельефе вам могут понадобиться для указания высот на маршруте, или для моделирования распространения каких-нибудь радиосигналов, или зон видимости.

Если вы просто хотите отображать подложку с рельефом - вам подойдет OpenTopoMap

Гора Бештау под Пятигорском выглядит в OpenTopoMap вот так
Гора Бештау под Пятигорском выглядит в OpenTopoMap вот так

Если вам надо получать высоты в заданной точке через API - можно воспользоваться, например https://www.opentopodata.org. Есть как публичное бесплатное API с ограничением на частоту запросов, так и возможность развернуть собственную копию.

Используется модель, построенная по данным дистанционного зондирования, с шагом сетки в несколько десятков метров. Вроде у автора есть более точная модель, но она уже платная.

Важный факт - спутник считает расстояние до ближайшего твердого объекта, а не до поверхности земли, поэтому в городе высота вполне может оказаться высотой крыши ближайшего здания.

Геокодирование

Прямое и обратное геокодирование - это связь между адресом и координатами. Во многих проектах требуется либо одно (получить координаты по адресу, например чтобы проложить маршрут), либо другое (получить адрес по координатам, чтобы отобразить пользователю в интерфейсе).

Каждый исследователь, которому понадобится такой функционал, столкнется с проблемой: какой из доступных сервисов выбрать?

  • Сервисы от гигантов рынка - Яндекс, Гугл, Here Maps и пр. Работают хорошо, умеют "додумывать за пользователя", угадывают неточно введенные адреса.
    Главных минусов для исследователя три:

    • Платность - хотят денег, иногда имеют бесплатный план, но с ограничениями, часто бесплатного плана просто нет

    • Привязка к карте. Требуют чтобы их результаты отображались только на их же карте. Нельзя, например, результаты геокодера Яндекса показать поверх OSM подложки.

    • Нельзя сохранять данные. Иногда делается исключение для возможности кеширования, но сохранить данные, чтобы потом по ним прогнать какой-то алгоритм, формально все равно нельзя.

      Из условий использования API Яндекс-карт, у остальных компаний правила схожие
      Из условий использования API Яндекс-карт, у остальных компаний правила схожие
  • Геокодер OSM - Nominatim. Бесплатно и сердито. Выше уже написал минусы, повторюсь:

    • Не умеет искать неточные совпадения (а фиг вам пользователи будут правильно всегда вводить).

    • Плохая база адресов (зависит от местности).

    • Жесткие лимиты на 1 запрос в секунду с последующим быстрым баном при нарушении.

  • Прочие сервисы, десятки их по запросу "geocoding api". Мне пока из опробованных больше всего понравился https://www.geoapify.com - они практически единственные, кто сумел найти мой дом по адресу, и при этом не имеют ограничения на сохранение данных и отображение на любых подложках. В свое время я даже в это не поверил и отдельно у них письмом это спросил, они подтвердили, что лицензионных ограничений нет. Вроде работают в основном поверх OSM, но имеют и еще какие-то другие источники данных.

Данные о ДТП

Их вполне официально отдает ГИБДД, но в неудобном формате. В удобном формате можно получить через замечательный проект Карта ДТП

Такие данные можно использовать для определения безопасности улиц, правда и тут не без подводных камней, перечеркивающих многие идеи для исследований. Например, некоторые категории редко проставляются в протоколах. Мы пробовали сделать исследование безопасности трамвайных остановок, сравнить количество наездов на пешеходов возле остановок с платформами и без (где пешеходы высаживаются сразу под колеса машин). Но, к сожалению, хоть такая причина ДТП (наезд на пассажира трамвая) там и есть, но встречается она очень редко. Большинство ДТП пишутся под общими категориями типа "наезд на пешехода", и попробуй отличи.

Также есть проблемы с координатами, подробнее в статье от авторов по ссылке выше.

Открытые данные местной администрации

В разных регионах разный уровень цифровизации. Где-то вполне можно найти открытые данные различной тематики, выложенные в интернете для всеобщего доступа. Главная проблема тут - что (почти) нет никаких единых стандартов. Каждый регион сам решает, что выкладывать и в каком формате. Зачастую у каждого региона есть своя информационная система обеспечения градостроительной деятельности, где можно посмотреть различные геослои, и иногда даже скачать их.

У СПб есть РГИС, в котором есть много чего полезного:

Аналоги для других регионов ищутся по запросу "ИСОГД %регионнейм%". Вообще сейчас идет мощный тренд на цифровизацию, в ближайшие годы все регионы заставят (кто еще не успел) создать такие системы и полностью перейти на цифровые документы территориального планирования.

Также можно походить по сайтам городских комитетов/департаментов/как еще они там будут называться в вашем регионе, и поискать разделы "открытые данные". Мы, например, используем данные от Комитета по градостроительству и архитектуре, чтобы оповещать градозащитников и экспертов о возможной будущей застройке. В КГА недавно создали реестр открытых данных, и сейчас расширяют его и дополняют новыми документами.

Про стандартизацию всего этого дела - есть, например, 10 приказ Минэкономразвития, там перечислены требования к геослоям генеральных планов, чтобы одни и те же объекты единообразно обозначались и отображались (вот тут я писал, как в джаве научиться рисовать объекты на карте согласно этому приказу). Это шаг в правильном направлении, но все равно остается куча видов градостроительных документов, где каждый регион будет изобретать свой велосипед в обозначениях и форматах.


Условно-доступные данные

Это, повторюсь, либо данные, скачиваемые через всякие хаки и торчащие наружу непубличные API с непонятным правовым статусом, либо данные, на которые явно наложены лицензионные ограничения. Используйте на свой страх и риск.

Данные о населении

Одним из краеугольных камней любых расчетов обеспеченности инфраструктурой являются данные о населении. Без них вы не сможете только лишь по карте понять, достаточно ли школ/поликлиник/детских садов или нет. Ну или сможете сделать только грубые прикидки по радиусам доступности, которые в наших реалиях (перенаселенные окраины городов с одной школой на 30 тысяч населения) вам мало что скажут.

К сожалению, из публично доступных данных такого рода мне попадалась только методика подсчета через данные ЦИК. Там на сайте можно найти перечень квартир во всех домах, в которых зарегистрированы избиратели. Начните вводить адрес и подсмотрите в веб-отладчике запросы к АПИ, которые он шлет, там иерархическая структура, от субъектов РФ и вплоть до отдельного дома и квартир в нем. Сами запросы тут приводить не буду, они время от времени меняются, так как это не публичное апи. Но отреверсить его и написать простой скрипт для скачивания всей структуры проблем быть не должно.

В итоге можно получить количество квартир в данном районе, после чего умножить на среднее количество жителей в квартире (где его взять - отдельный вопрос, я встречал цифры от 1.5 до 2-3) и получить какую-то грубую оценку численности населения.

Для некоторых регионов можно найти какую-то информацию на сайтах местных статистических ведомств. Вот, например, данные от Петростата за 2021 год - население с точностью до муниципалитета в СПб. Более точных данных по Питеру похоже ни у кого нет, во всяком случае публично.

Коммерческие заведения

Могут быть важны как с точки зрения инфраструктуры (чтобы рядом магазины были), так и с точки зрения оценки популярности каких-то точек в городе (больше кафе на крупных популярных улицах).

Какую-то информацию можно выцепить из:

  • OSM - как выше упоминалось, очень плохо с актуальностью, лучше не использовать

  • TripAdvisor - есть API, но формально нельзя обрабатывать и хранить

  • Google Places API - можно получать информацию о заведениях, отображаемых на карте гугла. Ограничения те же самые, что и у прочих сервисов - нельзя сохранять результаты, рисовать можно только на картах самого гугла.

  • Аналог от Яндекса, с аналогичными же ограничениями (не сохранять, только карта Яндекса), плюс еще лимит в 500 запросов в день, видимо чтобы не пытались вытянуть у них всю базу

Кадастровые участки

Росреестр ведет публичную кадастровую карту, но уже много лет сопротивляется всем попыткам сделать ее по-настоящему открытой и дать возможность пользователям получать координаты участков. Сейчас по факту можно только получить растровые картинки. Раньше был лайфхак: так как у них там ArcGIS используется, можно было подхимичить с параметрами запроса и получить участки в векторном SVG. Потом эту лазейку прикрыли, получить можно только PNG/JPG.

Кусочек кадастровой карты
Кусочек кадастровой карты

Сейчас можно вытащить оттуда растры по номеру участка, и путем нескольких преобразований (перевести в нужную систему координат, обвести границу полигоном) получить приблизительную (с погрешностью на растеризацию) форму участка.

Кажется, недавно видел про это статью на хабре про это, но сейчас не могу ее найти. На гитхабе есть вроде такой репозиторий, но я не знаю, жив ли он. Впрочем, Росреестр уже несколько раз менял апи кадастровой карты за последние пару лет, так что все готовые решения быстро устаревают и ломаются. Но написать с нуля свое - вопрос пары дней.

Плюс через API можно вытащить разрешенные виды использования участка, что важно для различных проверок и рекомендаций в области градостроительства.

Общественный транспорт

Тут тоже все так себе, кто в лес, кто по дрова. Данные об ОТ можно брать из:

  • Опять-таки OSM. Маршруты там есть. Реалтайм данных, разумеется, нет. Актуальность маршрутов... ну как и всего там - вызывает сомнения.

  • Гугл и Яндекс - тут особо не вчитывался, но вангую что ограничения те же, что и везде, показывать можно, хранить и обрабатывать нельзя.

  • Отдельные сайты и приложения у отдельных городов. Работоспособность, удобство и полнота данных сильно зависят от города. Как правило, каждый город пилит что-то свое.
    Есть попытка стандартизации через формат GTFS, именно через него работает Гугл, через него же можно получить реалтайм данные и расписание в СПб. Про другие города надо смотреть.
    Вот в Воронеже можно попотрошить АПИ их сайта с отображением транспорта, например https://vrnbus.herokuapp.com/map.html?bus_query=

В целом единообразного способа получения информации об ОТ даже в масштабах России не существует.

Парсинг соцсетей

Из постов в социальных сетях можно извлекать различную информацию, привязанную к местоположению. Из того, о чем я слышал:

  • Поиск туристических локаций - где больше фоточек люди делают, там наверное больше интересных объектов.

  • Сбор мнений и мониторинг настроений - можно пытаться искать какие-то конфликтные точки на карте города по негативным пользовательским комментариям.

  • Поиск отзывов на какие-то заведения или локации.

При этом есть ряд подводных камней:

  • Данные сильно зашумлены, надо уметь их разделять. Например, много фоточек люди делают и постят в аэропортах на прощание перед вылетом, но это не значит, что аэропорт это хорошая туристическая достопримечательность.

  • Смешаны данные от разных категорий людей - местных жителей, приезжих, туристов, просто проезжавших мимо. В итоге вы можете набрать лишних данных, нерелевантных для вашей ЦА.

  • Любая попытка что-то извлекать из текстов постов - это уже NLP задача, требующая соответствующих компетенций. Это не так-то просто, и часто выходит за рамки возможностей урбанистов-дата-сайнтистов. Поэтому нет смысла предлагать авторам небольших проектов "да что там, стащите все отзывы из вэкашечки и из местных сообществ".

  • Ну и как правило все это так или иначе нарушает правила пользования и лицензионные соглашения соцсетей

    Выдержка из пользовательского соглашения ВК, из раздела запретов
    Выдержка из пользовательского соглашения ВК, из раздела запретов

Закрытые данные

Это те данные, которые вы вряд ли сможете получить самостоятельно, либо они стоят слишком дорого для хобби-проекта. Но они тоже есть и могут использоваться для исследований и проектов крупными компаниями.

У нас в ИТМО довольно много связей с чиновниками различных регионов, благодаря чему мы иногда получаем доступ к такой информации. Хотя, надо понимать, это тоже не панацея, часто "секретные" государственные данные, на основании которых принимаются важные градостроительные решения - такое же черт знает как собранное и давно устаревшее фуфло, не выдерживающее пристального внимания и проверки.

Но в целом, конечно, доступ к такой информации позволяет заниматься чуть более интересным анализом, чем это доступно человеку с улицы.

Видов закрытых платных данных много, опишу только то, с чем сталкивался сам.

Социальная инфраструктура и население

В КГА наши студенты проходили практику и там они смогли получить данные об реальной численности учеников в школах, об их проектной мощности и реальной загруженности. На основании этих данных сделан https://schools.yourmaps.io.

Вот такие пироги в моем районе, данные неполные (нет кучи домов), но видно что заполненность школы 180% от расчетной
Вот такие пироги в моем районе, данные неполные (нет кучи домов), но видно что заполненность школы 180% от расчетной

Население по данным переписи (хотя бы с точностью до числа жителей в отдельном доме) вроде можно получить, но то что есть у нас - очень устаревшее (из нулевых годов).

Доступ к видеонаблюдению

В Питере есть программа "Безопасный город" - город методично обвешивают камерами, видео с них можно официально запросить в случае какой-нибудь неприятности.

Для исследователей же иногда есть возможность получить доступ к отдельным камерам и изучать что-то по видеопотоку. Мы один раз использовали это для анализа стихийной тропы на Марсовом поле (считали по видео пешеходов, шедших по газону).

Вид с камеры на столбе
Вид с камеры на столбе

Коллеги-транспортники из другой лаборатории вроде бы используют видео для анализа автомобильного траффика на ключевых перекрестках и настройки своей транспортной модели.

Данные мобильных операторов

С этим напрямую не работал, но знаю что такие обезличенные данные вполне официально можно купить. Цены там немаленькие, для отдельного исследователя или небольшого проекта неподъемные. Зато можно получить реальные маршруты жителей в городе. Очень важно для любых задач транспортной корреспонденции.

Коммерческие предприятия от 2gis

Если у вас серьезное исследование или проект, требующий детальной информации о коммерческих компаниях, вам придется эти данные купить. Но стоят они немало.

Вот пример расчета с сайта 2gis (многие говорят, что у них база наиболее актуальная) по Санкт-Петербургу. Это причем еще без контактов, с ними будет еще в два раза дороже.

Чего найти не удалось

Эти данные были бы полезны во многих исследованиях и проектах, и они часто всплывают тут на Хабре в комментариях и обсуждениях. Но в открытом доступе их нет, во всяком случае для РФ. Ну или мне не удалось найти, если в комментариях поправят - буду рад.

  • Данные о чистоте воздуха. Все что есть - либо крупномасштабное (пара цифр на город), либо это какая-то модель-надстройка над OSM (в духе "вдоль шумных улиц и фабрик плохая зона, вдоль парков хорошая"), со всеми его недостатками в виде проблем с покрытием или погрешностями в тегировании улиц.

  • Данные о городской растительности. В том же OSM кое-где прям отдельные деревья размечены, но в большинстве городов такого нет.

  • Данные о доступности для маломобильных граждан, велосипедистов и прочих колесных. В итоге почти все велосипедные навигаторы показывают фигню, заводя туда, где через каждые пять метров по поребрику.
    Есть исследования, где по панорамам Google Street View эту самую доступность распознают методами компьютерного зрения, но готовых к использованию данных я не находил.

  • Данные о пешеходной инфраструктуре. В OSM за пределами Питера и Москвы банально тротуары и пешеходные переходы мало где размечены. В государственных ГИС тоже зачастую не хватает всяких дорожек-тротуаров.
    В итоге качество именно пешеходной навигации сильно страдает, а исследования на эту тему (наподобие моего анализа "пешеходных кривулей", мест где слишком велико расстояние между пешеходными переходами) оказываются очень неточными.

  • Спутниковые снимки. Если вам нужна бесплатная открытая карта - есть OSM. А вот если вы захотите добавить спутниковую подложку в свой коммерческий проект - то фиг вам. Яндекс вот даже за деньги не дает доступ к своим спутниковым снимкам из-за каких-то лицензионных сложностей.
    Есть какие-то публичные архивы, но там качество снимков очень плохое и они старые обычно. Использовать их для актуального картографического приложения не получится.
    Ситуация понятная - если карту волонтеры могут нарисовать в качестве хобби и бесплатно, со спутниковыми снимками (особенно высокого качестве, пригодными для картографической подложки) так не выйдет, это всегда коммерческий продукт. Но обидно.

Монетизация

После того, как вы создали какое-то приложение с картой и какими-то данными на ней, может возникнуть желание на нем заработать.

Очевидным методом монетизации для приложения с картой может показаться путь Гугла/Яндекса - отображение маркеров коммерческих заведений с комиссией за клик.

Однако оказывается, что просто не существует (опять же, поправьте если я ошибаюсь) никаких рекламных сетей, предоставляющих такую функциональность. Чтобы можно было по API получить у них список объектов на карте в заданной области, и потом получить комиссию за клик пользователя. Вообще, как мне кажется, интересная идея для стартапа в этой области - рекламная сеть для отображения объектов на карте.

Существующие API для получения коммерческих объектов, перечисленные в разделе про открытые данные выше, не дают вам лично никакого профита. Все деньги за клики по ним получит их хозяин (гугл или TA).

У TripAdvisor есть партнерская программа, но там все сложно - вы получите деньги, если человек перейдет по вашей ссылке на TA, а там забронирует отель или еще что-то (не обязательно то, на что вела ваша ссылка).

Вообще похоже, что вся туристическая интернет-отрасль монетизируется исключительно бронированием билетов (партнерки у всех крупных сайтов типа aviasales или tutu), туров (тут самый популярный это travelpayouts, это вообще крупный агрегатор партнерок в сфере туризма) и отелей (всем известный букинг и аналоги). Если ваш проект никак с этими сферами не связан, то и заработать нативным образом на вашей карте вы не сможете. Придется использовать обычные методы монетизации (платные фичи, рекламные баннеры), не специфичные конкретно для картографических и навигационных приложений и не использующие их возможности.


Заключение

Надеюсь, эта статья поможет как будущим авторам ГИС и урбанистических веб-сервисов - не лезть туда, где все равно ничего не выйдет из-за недостатка данных, так и пользователям - понять, почему все работает не идеально, а сделать лучше в текущей ситуации не получится.

Вкратце просуммирую основные проблемы, которые вы должны понять и проверить, прежде чем начать разработку своей идеи:

  • Самый лучший алгоритм не сработает, если нет достаточно точных данных. Подход "ай ладно, ща запилим алгоритм, а данные потом поищем" не работает, без данных ценность вашего алгоритма для пользователей равна нулю, или даже отрицательна (если он дает ошибочные рекомендации).

  • OSM это здорово, но есть проблемы с качеством и полнотой, некоторые категории данных (коммерческие заведения, транспорт, озеленение) там формально есть, но в большинстве случаев непригодны для серьезного использования.

  • Некоторые вроде бы очевидные и нужные данные взять просто неоткуда.

  • Очень много данных закрыто лицензионными ограничениями, пользоваться ими можно только по методу Неуловимого Джо - надеяться, что вас не заметят и не засудят.

  • Если поискать - можно найти много интересных данных от чиновников и местных администраций, но нет общих стандартов, везде все по-разному, в итоге очень сложно или вообще нереально сделать решение, работающее для всей территории РФ.

Напоследок могу порекомендовать чат в телеграме по открытым данным в РФ - https://t.me/opendatarussiachat. Сразу скажу, что вопросы типа "где взять кадастровые участки" там уже являются платиновыми, и в ответ вы разве что горький смех получите, но какие-то менее тривиальные вещи там можно найти и узнать.

Если у вас есть опыт работы с этими или любыми другими открытыми данными, пригодными для анализа городских территорий - пишите в комментариях. Тема нынче востребованная и наверняка эта информация многим окажется полезной.

Комментарии (56)


  1. uburame
    21.10.2021 16:23
    +3

    По поводу

    И для тех же дорог есть дай бог штук 10 различных вариантов (в OSM это всякие теги primary-secondary-service-residential и еще ряд других), которые просто никак не могут покрыть все разнообразие всех возможных видов покрытия и состояния проезжей части.

    Могу сказать, что в OSM есть тэг Surface, который в первом случае будет = Asphalt, а во втором ground, mud или dirt. А для оффроада есть аж 5 градаций разбитости дороги для highway=track.


    1. JediPhilosopher Автор
      21.10.2021 16:39
      +2

      Ага, а еще там есть теги для разных пород деревьев, только кто ж их ставит-то?
      Вообще в целом люди любят размечать крупные фичи - дома, дороги, рисовать карту "большими мазками", так как это наглядно показывает прогресс. Вот было чистое поле, а вот я полчаса порисовал и уже целый район готов.

      А возиться с мелкими тегами хочет мало кто (это кстати мне даже попадалось в каком-то исследовании качества покрытия OSM). Ну не хотят люди тратить время на какую-то мелочную расстановку отдельных тегов.

      В итоге все равно найдется куча мест, где этих тегов нет, и все что у вас есть - это тег highway. Вот и гадайте, вести по нему маршрут или нет.


      1. uburame
        21.10.2021 16:45
        +1

        А это уже другая проблема :)


        1. JediPhilosopher Автор
          21.10.2021 17:05

          Ну не так важно, та или не та. Важно, что не существует универсальных работающих решений, любой навигатор вынужден использовать какие-то эвристики чтобы различать ребра, которые в сырых данных карты размечены одинаково.

          И наверное важно как-то людям об этом говорить, иначе они начинаю злиться. Потому что им-то очевидно, что эти две дороги разные по качеству, а навигатору почему-то не очевидно.


  1. roman_deev
    21.10.2021 16:32

    А что скажете про геокодер Photon? На первый взгляд выглядит лучше Nominatim: подсказки при наборе даёт, ошибки учитывает


    1. JediPhilosopher Автор
      21.10.2021 16:36

      Вроде когда я его смотрел - мой адрес он не мог найти (в отличие от geoapify). Сейчас находит. Возможно кто-то таки добрался и разметил в OSM адреса правильно в этом районе, может еще что-то изменилось.

      Внизу дисклеймер опять про fair use - это всегда немного пугает, черт его знает, что они решат фэйр юзом, а что нет. Коммерческие геокодеры с бесплатным планом в этом смысле понятнее - там обычно четко прописано, сколько запросов можно делать.


  1. drWhy
    21.10.2021 16:39
    +2

    «Данные о доступности для маломобильных граждан, велосипедистов и прочих колесных. В итоге почти все велосипедные навигаторы показывают фигню, заводя туда, где через каждые пять метров по поребрику.

    Данные о пешеходной инфраструктуре. В OSM за пределами Питера и Москвы банально тротуары и пешеходные переходы мало где размечены. В государственных ГИС тоже зачастую не хватает всяких дорожек-тротуаров.»

    КМК тут системная проблема, начиная от отсутствия требований к наличию связной сквозной сети дорожек/тротуаров и, как следствие, маниакального ограничения участков заборами и другими препятствиями. Понятно желание владельца участка отгородиться от внешнего мира, непонятно как могут выделяться соседние участки без обязательного зазора между ними для обустройства сквозных дорожек.
    Отсутствие такой сети делает невозможным передвижение в выбранном направлении на длительные дистанции — приходится постоянно петлять, что заметно удлиняет путь. Зачастую там, где дорожки есть — они сознательно не ведут в каком-то определённом направлении, к примеру практически радиальные дорожки в парках — они для прогулок, а не для передвижения.

    Вторичная проблема — сегментированность хотя бы имеющихся дорожек/тротуаров, ведь часть из них является элементом обустройства дорог, часть принадлежит к придомовой территории, а огромная часть вообще бесхозна, т.к. фактически является «звериными тропами», протоптанными жителями микрорайонов в поисках кратчайшего пути к объектам инфраструктуры, местами присыпанными асфальтом или случайным мусором.

    То есть нет единой концепции формирования дорожек или она не соблюдается.
    Потому и нет полной информации в государственных ГИС о дорожках — ей там просто неоткуда взяться, нет дорожек — нет проблем, ведь достаточно нанести все необходимые дорожки на карту — следующим вопросом встанет соответствующий бюджет. А ведь выделять его придётся полностью за счёт казны — пешеходы ведь не платят дорожного налога. И зачем строить дорожки, если ту же площадь можно продать под киоски?

    Каково было бы водителям автомобилей, если бы сплошные дороги отсутствовали, а имелись бы отдельные невзаимосвязанные сегменты, проложенные «не совсем в том» направлении, с разной шириной, типом покрытия и непредсказуемым количеством бордюров различной высоты на километр пробега и отсутствующей ливнёвой канализацией, к тому же бесконтрольно перекапываемые в любой момент с негарантированным восстановлением?

    Соответственно, практически нет тротуароуборочных машин за исключением тех же парков отдыха — они просто не пройдут по большинству дорожек, а значит уборка дорожек от снега/листьев и мусора является делом довольно случайным, опять же в отличие от дорог.
    Да и ответственность за порчу проезжей части и тротуара сильно различается — не зря ведь под дорогой при прокладке коммуникаций делают проколы, а тротуары безнаказанно перерывают пару раз в год при постоянных прокладках и ремонтах всяческих коммуникаций, ведь подрядчики не обязаны восстанавливать целостность покрытия, в лучшем случае присыплют канаву щебёнкой.

    Пока целостной концепции не будет — навигаторы продолжат показывать фигню, а пешеходы и прочие колёсные — совершенствоваться в передвижении по пересечённой местности, льду, неубранному снегу в намокшей от луж обуви и обходя припаркованные на тротуарах автомобили.

    Спасибо за поднятие сложной и злободневной темы.


    1. JediPhilosopher Автор
      21.10.2021 16:43
      +1

      Нуу, не все так грустно, у нас в питерском РГИС даже есть слой с полигональными тротуарами, правда только для центра.

      Эти данные все равно у кого-то где-то должны быть, как иначе в городе тогда делают всякие ремонты - там же нужно знать, где что находится. Просто эти данные часто не оцифрованы, и лежат в папках в архиве какого-нибудь ведомства.

      Но как я написал, цифровизация идет, в ближайшие годы всех пинками будут загонять в необходимость вести все генпланы, ППТ и прочую документацию в векторе по единому стандарту, принимать проекты зданий в BIM и т.п


      1. drWhy
        21.10.2021 16:53

        Пинками может не получиться то, чего хотелось бы. Наблюдал обсуждение на совещании главного инженера и энергетика крупного ТРЦ по поводу предстоящего нанесения дорожной разметки на предмет противоречивых данных о местоположении столба на территории в двух разных планах. Вместо пройтись по территории и рулеткой измерить актуальное положение столба было принято решение изменить положение в одном из планов «потому что столб так стоять не может».
        Но какой-то прогресс, конечно, есть.


        1. drWhy
          21.10.2021 21:55

          Хотел ещё отметить, что для подбора маршрута для колёсников и шагоходов может быть полезен OSM с включённым слоем "Общедоступные GPS-треки".

          Этот же слой можно использовать для планирования строительства новых дорожек, находя на местности возможности для устранения петель объездов.

          Кстати, может кто-нибудь подскажет — как в OSM отключить собственно подложку, оставив только треки?


          1. Moskus
            22.10.2021 10:30
            +2

            Слой треков имеет жуткое качество, а также отражает вообще все треки (кое-где - кроме самых свежих, потому что его обновление - сломано, хотя и не полностью) "с начала времён". То есть, включая перестроенные много лет назад дороги, "кляксы" от дрянных китайских автонавигаторов. Так что категорически не советую использовать этот слой вообще, без строгого понимания, что именно он показывает в каждой конкретной точке. Единственный относительно осмысленный способ работы с этой помойкой - использовать OSM API и фильтровать треки https://wiki.openstreetmap.org/wiki/API_v0.6#GPS_traces


            1. drWhy
              22.10.2021 13:01

              Спасибо за подсказку. Да, обратил внимание — треки похоже есть и снятые в самолёте, и на кораблях, автотранспорте и даже на горнолыжных трассах.
              Всё же на незнакомой местности степень «натоптанности» намекает на наличие проезда и качество дороги — тропинок в лесу или «сквознячка» через дворы.
              Главное — чтобы туда не посыпались массово треки с дронов, это точно усложнит поиск маршрута.


        1. drWhy
          21.10.2021 23:02

          Жизнь подаёт идеи. В доме второй день нет горячей воды. На сайте госпредприятия-поставщика есть информация об аварии с перечнем затронутых номеров домов. Хорошо было бы, если бы существовал сервис, обобщающий подобную немаловажную информацию, влияющую на качество жизни — ведь после прокладки маршрута и вечерней прогулки контрастный душ гораздо приятнее ледяного.

          Можно было бы ка карте города отображать ход всех текущих аварийных работ, а также накапливать статистику по «авариям» на одних и тех же местах, ведь в прошлом году в том же месте уже рыли…
          Пользователи могли бы оперативно добавлять информацию о новых ручьях поверх асфальта, зимой быстро превращающихся в ледяные торосы, а водители встретившихся на них авто могли бы аппелировать к наличию подобных препятствий и рассчитывать на возмещение стоимости ремонта за счёт нерадивых городских служб…
          Отдельным слоем неплохо бы указать все дорожные работы в состоянии прогресса, особенно бывшие-будущие тротуары с сорванным асфальтом, отсыпанные крупной щебёнкой и ожидающие выпадения первого асфальта (однажды двор многоподъездного дома в таком состоянии простоял ровно полгода — в отсутствии фонарей тот ещё квест был зайти домой).

          Заодно можно было бы автоматизировать отслеживание случаев забывчивости поставщиков услуг, когда оплата начисляется за полный месяц, включая дни, когда услуга фактически не поставлялась в полном соответствии с официально зарегистрированной аварией.


  1. Moskus
    21.10.2021 21:24
    +2

    Несколько лет назад писал о неоднозначности обозначений, своевольности их интерпретации участниками, а также проблеме обозначений, соответствующих составным понятиям в OSM https://habr.com/ru/post/269733/ - с тех пор лучше не стало, стало хуже, потому что задача "сделать лучшую бесплатную картографическую базу данных всего мира" заброшена, основная задача теперь - "получать удовольствие", что означает пренебрежение к самой идее существования стандартов.


    1. JediPhilosopher Автор
      22.10.2021 00:32

      Интересная статья, спасибо за ссылку.


  1. karavanjo
    21.10.2021 22:13
    +4

    Еще данные можно приобрести у NextGIS - https://data.nextgis.com/ - есть данные OSM, уже конвертированные в популярные форматы и собранные в готовые проекты для QGIS, ArcGIS, MapInfo. Там же можно найти данные по жилым многоквартирным домам из «Реформы ЖКХ» и по рельефу.


    1. Moskus
      21.10.2021 22:59

      Данные по "рельефу" (на самом деле - нет) - те же что доступны бесплатно у NASA/JAXA


      1. karavanjo
        21.10.2021 23:14
        +1

        "Данные, доступные бесплатно" не всегда означает, что они "доступны удобно". Если есть время, можно самостоятельно и бесплатно выкачать данные, склеить для нужной территории, обрезать, поискать способы построения горизонталей. Сервис же все это делает за пользователя.


        1. Moskus
          22.10.2021 10:17

          Вы сами ниже написали, что было бы лучше, если бы все указывали источники. Вот я и сэкономил кому-то время, если кто интерпретировал ваши слова про "данные по рельефу", гхм, слишком оптимистично. Потому что преодолеть проблему скачивания, обрезки и конвертирования можно известными способами, обменяв свое время (в этом суть самостоятельной разработки, не так ли?) на результат. А вот получить лучшие данные, которые действительно показывают рельеф, а не крыши домов и кроны деревьев - это уже совсем-совсем другая история.


          1. JediPhilosopher Автор
            22.10.2021 10:39

            А у кого вообще можно такие данные - с настоящим рельефом - взять? А то для меня в свое время это тоже сюрпризом оказалось, когда стал высоты треков считать и в городе увидел странные скачки по 30-50 метров.


            1. Moskus
              22.10.2021 11:31
              +2

              Как вы думаете, почему у Яндекса нет такого варианта отображения карты, несмотря на привилегированное положение в части доступа к гос. данным (всякое там положение общественного транспорта и т.п.)? Если коротко, то на территорию России такие данные вы иметь не хотите, потому что не хотите связываться с ФСБ. Для личного же пользования, можете либо оцифровать горизонтали с каких-нибудь утёкших у государства топокарт удовлетворительного масштаба, а потом интерполировать их в DEM, либо купить данные у JAXA https://www.aw3d.jp/en/products/standard/ (вас интересует DTM).


              1. JediPhilosopher Автор
                22.10.2021 13:00
                +1

                Дичь какая. Впрочем после того, как я узнал что наши местные системы координат, в которых делается градостроительная документация, являются секретными, и официальных параметров всяких эллипсоидов в открытом доступе нет (то что есть - восстановлено ручками), я уже ничему не удивляюсь.


                1. drWhy
                  22.10.2021 13:08

                  Так всё от СК-42 вроде бы топчется.
                  А рельеф можно попробовать попросить у подрядчиков сотовых операторов.


                  1. Moskus
                    22.10.2021 17:30

                    Интересно, на чём основана ваша идея, что они дадут. И почему именно они.


                    1. drWhy
                      22.10.2021 18:28

                      Операторы должны учитывать рельеф местности при планировании установки базовых станций. Самостоятельно весь комплекс работ они не выполняют, привлекая подрядчиков. Дадут или не дадут — вот в чём вопрос.


                      1. Moskus
                        22.10.2021 19:05

                        Сюрприз, вообще почти кто угодно, занимающийся строительством сложнее рытья траншеи тремя гастарбайтерами, "должен учитывать рельеф". Весь вопрос лично у меня - с какого перепугу строительный подрядчик решит заниматься распространением данных, которые входят в круг интересов упомянутого уже ФСБ.


                      1. drWhy
                        22.10.2021 19:49

                        Разве любой застройщик просчитывает видимость местных достопримечательностей из окон пентхаусов?
                        Насколько мне известно, картографические данные вполне официально продаются.


                      1. Moskus
                        22.10.2021 19:53

                        Для анализа видимости нужны данные не только и не столько о рельефе. Вот для строительства домов - как раз именно рельеф, поверхность земли.

                        По-моему, вы валите разнородные вещи в кучу и имеете странное представление об обороте некоторых видов данных в рамках лицензируемой деятельности.


                      1. drWhy
                        22.10.2021 20:42

                        Насколько я понимаю вашу точку зрения — для строительства дома нужно разрешение ФСБ.


                      1. Javian
                        22.10.2021 20:46

                        Есть места, где люди купили участки и оказалось, что не могут построить второй или третий этаж. ФСБ запрещает т.к. эти этажи появятся в ландшафте над видимой линией горизонта от радиообъекта ФСБ.


                      1. drWhy
                        22.10.2021 20:58

                        Буду знать, спасибо.


                      1. Moskus
                        22.10.2021 21:05

                        Это верно, но это только косвенно относится к проблеме лицензируемой деятельности, о которой я говорил.


                      1. JediPhilosopher Автор
                        23.10.2021 12:48
                        +1

                        Ну такие штуки обычно нормируются в местной градостроительной документации и называются ЗОУИТ - зона с особыми условиями использования территорий. Там как раз всякие охранные зоны всего подряд (труб, аэропортов, памятников) Плюс еще есть правила землепользования и застройки, где тоже как правило нормируется этажность и высота над уровнем земли. Тут ничего секретно-фсбшного нет.


                      1. Moskus
                        22.10.2021 21:04

                        Фу, какая грязная и невежественная подмена понятий. Стоило вас поймать на умозрительных рассуждениях...

                        Лицензия на картографическую деятельность нужна для обращения с данными о рельефе после некоторых значений площади покрытия этих данных. В случае общегородского проекта анализа какой-нибудь велодоступности, покрытие будет явно больше "безлицензионных" площадей.

                        Плюс, она нужна не самим строителям, а проектной организации.


                      1. drWhy
                        22.10.2021 22:41

                        Умозрительность и невежественность — они такие, да. Вот вы, к примеру, не знали что на токарных станках производят не только фигуры вращения. Это делает вас невежественным?
                        А владение текущим состоянием дел по какому-либо вопросу в отличие от оппонента разве поможет перестать быть невежей?

                        Двадцать лет назад я присутствовал на переговорах с картографической организацией по поводу приобретения картматериала масштаба облцентра для запуска службы диспетчеризации транспорта. Звучали внушительные, но вполне понятные цифры, речи о необходимости получения лицензии не было.
                        Google Maps и OSM тогда ещё не было и покупка картматериала была единственным вариантом для запуска сервиса.
                        В итоге проект не состоялся по другим причинам.


                      1. Moskus
                        22.10.2021 23:37

                        Почему не знал-то? Знал, потому написал тогда "главным образом ...", если верно помню. А вам понадобилось уже тогда подменить тезис и вылезти с редким примером, который не опровергает ничего, потому что исходное утверждение не содержало квантор всеобщности.
                        Так у вас еще какой-то старый butthurt, что вы за моими "ошибками" охотитесь? Занятно.

                        Вы сейчас игнорируете разницу между конкретными данными о рельефе, покрывающих больше чем определенная площадь и картографическими данными вообще.


                      1. drWhy
                        23.10.2021 10:00

                        Не верно помните — «большинство станков способны производить только цилиндрические или конические детали» была формулировка, вполне недвусмысленная. Чуть более чем на любом токарном станке без дополнительной оснастки можно производить, к примеру, прямоугольные призмы. Просто подвернувшаяся иллюстрация невозможности полной непогрешимости.

                        Вы игнорируете приведённый пример реального взаимодействия с картографической организацией по поводу приобретения данных в масштабах, более чем перекрывающих упоминаемые вами. В принципе речь шла о не ограниченном наличием лицензии приобретении картматериала по городам в масштабе 1:10 000 и по областям 1:100 000 для внутреннего использования диспетчерской службой и предоставления онлайн-доступа пользователям.


                      1. Moskus
                        23.10.2021 19:51

                        Я готов поспорить, что картматериалы, о которых вы говорите, не содержали горизонталей, описывающих реальеф с подробностями, достаточными для отнесения их к секретным. Потому что для создания диспетчерской системы это не нужно. Потому ваш пример не имеет отношения к делу.

                        Что касается станков - вы, конечно, можете считать что угодно, а я, даже если бы считал нужным, не смог бы вам доказать что-либо. Но это довольно маловероятно, что человек, который пользуется токарным станком с шести лет и работает инженером на производстве, как минимум, никогда не видел подобных поделок, а как максимум - никогда не делал ничего подобного. Тем не менее, есть огромная разница между "можно извернуться и сделать для прикола, используя приспособления, которые годятся только для подобных трюков" и "такое делается постоянно". Вы эту разницу, скорее всего - намеренно, игнорируете. Знаете, есть такая привычка у некоторых, хвастаться знанием особых случаев в ситуации, которая ясна как день, потому никому другому говорить об особых случаях в голову не приходит. Если вам нравится играть в эту игру - играйте сами с собой.


                      1. Moskus
                        22.10.2021 23:44

                        Почитайте для самообразования с начала этой страницы до конца: https://gis-lab.info/forum/viewtopic.php?f=48&t=3893&start=285


              1. vasyaabr
                22.10.2021 13:19

                Купить у JAXA для лично использования - это всё таки довольно сильно... При их ценах и минимальных партиях заказа желание сразу пропадает.


                1. Moskus
                  22.10.2021 17:28

                  Я не думаю что от того, что цена высока, о чем-либо стоит говорить, как о невозможном.


                  1. JediPhilosopher Автор
                    22.10.2021 17:59

                    Обычно подобные проекты (про которые написано в статье) пилят либо энтузиасты, либо ученые. У них, как правило, нет миллионов рублей на закупку баз данных. Тот же 2gis мало кто может себе позволить купить для своего пет-проекта.


      1. karavanjo
        21.10.2021 23:17

        Данные по "рельефу" (на самом деле - нет) - @Moskusвы имели ввиду, что это данные радарной съемки и высота получается с учетом высоты зданий, растительности и прочего? Или что-то другое?


        1. Moskus
          22.10.2021 03:16

          Да, именно это, потому что всё что доступно на Россию бесплатно или почти бесплатно - это или радарные данные, или данные из стереопар.


    1. JediPhilosopher Автор
      21.10.2021 23:28

      У данных OSM хватает недостатков (описанных в статье), и тут уже не важно, в каком формате оно идет.

      На самом деле отдельная проблема - когда находишь какой-то интересный источник данных, обещающий золотые реки и алмазные горы. А по факту оказывается что там просто какая-то модель поверх OSM, и там где данные OSM фиговые, то и их модель фигню выдает.


      1. karavanjo
        21.10.2021 23:49

        Все зависит от требований конкретного проекта - есть проекты, где OSM прекрасно подойдет даже с перечисленными в статье недостатками. Опять же - это не просто open-source источник данных - это и пространственная БД, которую можно (и нужно) улучшать - и проблемы с детализацией/конвенциями и пр. будут решаться. Все это решается с развитием сообщества. Если люди начинают относиться только с потребительской целью - то, проблемы не разрешить, т.к. сообщество просто исчезает и исправлять уже некому.

        какая-то модель поверх OSM, и там где данные OSM фиговые - да, согласен с вами, если бы все источники данных указывали на каких данных они строят свои модели - было бы отлично. Но, с другой стороны, приведенный вами опыт показывает, что OSM хорошо известен и доступен.


  1. Javian
    22.10.2021 13:06

    туристическая интернет-отрасль

    Это можно было увидеть еще в начале 2010-х, когда Google экспериментировал с рекламой на Maps/Panoramio. Насколько я помню инсайд от соотечественника в Google "овчинка не стоила выделки". Собственно что в конце концов привело к закрытию Panoramio. Просмотры достопримечательностей не превращались в заказы гостиниц, билетов и т.п.


    1. JediPhilosopher Автор
      22.10.2021 13:34
      +1

      Мне еще попадалась история стартапа Utrip и нескольких подобных - там они пытались (похоже на мой проект Sight Safari) строить интеллектуальные маршруты по городу, с осмотром достопримечательностей и заходом в отели/рестораны. Сколько-то лет он потрепыхался, но тоже в итоге не выжил.

      Есть еще ряд проектов - планировщиков туров, но про них инфы никакой нет. Но не особо похоже чтобы они были прибыльны. Зато наткнулся вот на такой разбор - Why you should never consider a travel planning startup

      Приложения с аудиогидами и экскурсиями тоже постоянно создаются а потом непонятно как выживают (тот же izi.travel уже банкротился один раз, маркетплейс туров так и не сделал прибыльным maps.me).

      Жалко, идея какой-то умной навигации для туристов витает в воздухе, много раз за нее кто-то брался, но похоже денег там действительно нет. Сфера туризма сама растет год от года (ну или росла до ковида), но вот его атйишная часть за пределами отелей и авиабилетов так и топчется на месте.

      В связи с этим у меня и была идея сделать рекламную сеть для таких приложений. Как говорится, если не удается заработать на добыче золота - можно попробовать заработать на продаже лопат для тех, кто продолжает пытаться его добывать.


      1. Javian
        22.10.2021 21:01
        +1

        По-моему проблема подобных проектов однотипна - разработчики сами не будут пользоваться тем, что у них получилось.


        1. JediPhilosopher Автор
          23.10.2021 12:50

          Ну не факт. Я своим SightSafari вот пользуюсь в поездках. Но вот как его монетизировать - реально непонятно.

          Есть куча примеров замечательных полезных сервисов, на которых тем не менее непонятно как именно заработать.


  1. Akr0n
    25.10.2021 05:22

    Данные о чистоте воздуха можно брать с maps.sensor.community, opensensemap.org, chillibits.com, madavi.de. Есть города, где датчиков довольно много (к примеру, Омск), а вешать их на каждом доме и смысла-то нет.


    1. JediPhilosopher Автор
      25.10.2021 17:36

      Спасибо за ссылки, но:

      1. На maps.sensor.community в СПб 6 датчиков

      2. На opensensemap.org один

      3. На chillibits.com есть только андроид-приложение, не смог оценить

      4. На madavi.de не разобрался, вроде есть только ссылка на карту из первого пункта

      В целом то что я и говорил - есть данные только крупного масштаба, типа пара цифр на пятимиллионный город. Для какой-то статистики может и достаточно, для картографических проектов районного/городского уровня - нет.

      Для Европы там получше вроде, но для России все печально.


      1. Akr0n
        26.10.2021 05:09

        Да, люди у нас ничего не хотят сделать для своего благополучия и это печально. Но опять же, позитивный пример Омска или Красноярска в этом плане.
        По большим городам типа СПб можно и нужно требовать официальные подробные данные (они должны быть), а потом верифицировать их с помощью, например, этих 6 независимых датчиков.
        3. Там есть доступ по веб через подобного рода ссылки — pm.chillibits.com/s/9987184. Получить такую можно один раз поделившись из приложения.
        4. Тут ссылки в таком формате — api-rrd.madavi.de/grafana/d/q87EBfWGk. Поиск по ID чипа, его можно увидеть на других картах.


        1. Javian
          26.10.2021 13:37
          +1

          Был у меня экспириенс общения с людьми на тему. На Facebook в ленте попался пост про горение свалки возле одного города. Куча народа в комментариях возмущаются о вреде дыма, о проворовавшейся мэрии. Я комментирую что-то вроде что уровень задымленности можно увидеть maps.sensor.community и вообще собрать собственный сенсор (даю ссылку на статью на хабре) и контролировать уровень загрязнения воздуха лично. В комментариях появляются дамы с возмущением что зачем я про это пишу, если на карте нет датчиков в их городе, а ближайшие в соседних городах.

          В этот момент проникся к Шапокляк и её философии "Кто людям помогает — тот тратит время зря.". И просто заметил, что 3000 руб за такой сенсор небольшие деньги, если речь о личном здоровье.


          1. AmberSP
            30.10.2021 16:50

            А есть ли что-то подобное для химических загрязнений? Живу сейчас в Ярославле и тут регулярно воняет что-то серное и что-то нефтяное. Толи НПЗ, толи нефтебаза, толи свалка. А то и всё по очереди. PM2.5 indoor в порядке, госуслуги переводят стрелки на роспотребнадзор, а тот молчит, как страус об лёд.


            1. Akr0n
              31.10.2021 02:57

              Датчики для сложных загрязнений очень дорогие, сомневаюсь, что даже в Европе есть такое. Гидрометцентр должен это все замерять, а информацию выкладывать в паблик. Напишите им официальное письмо через сайт с требованием предоставить архив данных.