В статье будет описан способ, как можно использовать фотограмметрию для определения координат подвижных и статичных объектов с летательных аппаратов. Практическое применение данного метода пока что затруднено по причинам, которые будут указаны ниже.

Задача: В системе координат, для которой известны GPS координаты (обозначена на рисунке красным цветом) определить расстояние и вектор направления для объекта, обозначенным на рисунке желтым крестиком. Затем, соответственно определить GPS координаты этого объекта.

Теперь пара слов про фотограмметрию.

Фотограмметрия позвояет создавать 3д модели по фотографиям. Все этапы создания 3д объектов нам в данном случае не нужны, а нужен только этап достройки отдельных поверхностей модели дополнительными фотографиями. Бывают ситуации, когда 3д модель уже построена, но качество некоторых элементов или поверхностей хочется улучшить. Тогда к готовому проекту можно добавить одну или несколько фотографий нужных элементов.

Каждая пирамидка на этой gif это местоположение камеры при съемке фото. Добавление новой фотографии в проект требует вычисление координат места съемки новой фотографии.
Каждая пирамидка на этой gif это местоположение камеры при съемке фото. Добавление новой фотографии в проект требует вычисление координат места съемки новой фотографии.

Решение задачи по сути заключается в переносе системы отсчета в местонахождение искомого объекта и предварительном построении 3д модели данного объекта.

 фотография, сделанная с беспилотника является дополнительной к нескольким сотням фотографий с координатами, на основе которых предварительно  построена 3д модель объекта.
фотография, сделанная с беспилотника является дополнительной к нескольким сотням фотографий с координатами, на основе которых предварительно построена 3д модель объекта.

На практике добавление одной фотографии с вычислением ее координат занимает в среднем проекте около 5 минут на десктопном процессоре. Отсюда и главное ограничение применения данного метода. Обработка 1 секунды видео 1080р с частотой 30 к/сек заняла бы примерно 150 минут (или 9000 секунд). То есть для обработки видеопотока в реальном времени нужен процессор в 9000 раз мощнее современных десктопных типа core i5

Проблему нехватки вычислительной мощности возможно получится решить оптимизацией архитектуры вычислений и перенесением их на видеокарты вместо процессоров. Мы этим сейчас занимаемся, хотя и не особо успешно пока.

Вместо вывода. Если мы сможем ускорить вычисления в 9000 раз, то что у нас получится? Получится программа, которая определяет местоположение только одного объекта (даже не типа объектов, а одного объекта). Для детекции и локализации второго объекта нужна вторая программа, и так далее. Это не похоже на современные системы машинного зрения, которые детектируют и классифицируют сотни и тысячи объектов. Скорее такая система будет напоминать концепцию "нейрона бабушки", о которой говорят российские нейробиологи Константин Анохин и Татьяна Черниговская.

Комментарии (7)


  1. Lotov
    01.06.2026 03:52

    А наплевать мне на всё , не пойду на работу сегодня . Есть у меня литр водки , буду сидеть сиднем и слушать рассказы О.Генри., пропадиде вы с этой сво пропадом.


  1. mmMike
    01.06.2026 03:52

    Глядя на фотку с характерным видом дрона, даже хорошо, что такую в принципе простую геометрическою задачу решают и не могут решить. Хотя, почему то сразу вспоминается анекдот про “гланды удалять через анальное отверстие”.

    Проблему нехватки вычислительной мощности возможно получится решить оптимизацией архитектуры вычислений Мы этим сейчас занимаемся, хотя и не особо успешно пока.

    На меня как то выходили (скорее всего провокаторы из ФСБ, но мало ли…") с темой “а не сделаете ли нам ПО для управления парусами на дроне на ESP32”.

    Так что… днище с дронами еще не пройдено. Будут и максимально дешевые долго дрейфующие мины стоимостью в 50-100 тыс. рублей неожиданно приплывающие на пляжи/корабли той или другой стороны.

    Найдут же кого ни будь кто напишет. За деньги или из “патриотизма”.


    1. malyazin_2010 Автор
      01.06.2026 03:52

      Единственная компания, которая хорошо решает эту простую геометрическую задачку это tesla. Остальные решить не могут, поэтому используют лидар для измерения расстояния до объекта.


    1. gerbert_MX
      01.06.2026 03:52

      Спасибо провокаторам за их тупость) esp32 заменил ардуино за цену/возможности, но использовать esp32 в автономках так себе идея из-за его прожорливости (даже с глубоким сном и наличием очень емкого аккумулятора под боком)

      Но вообще не минами едиными - гораздо хуже что развивают автономную авиацию "как умеют". Дроны что сами наводятся на людей/машины гораздо опаснее ведь военным в целом плевать даже на точность, не то что на качество. Это Тесла может бороться за качество ведь коммерческий продукт, а воякам будет достаточно "поражено 80% целей", причем даже не важно каких, "цели" можно будет нарисовать постфактум по местам куда попало.


    1. provide
      01.06.2026 03:52

      Технология геолокации уже есть: https://habr.com/ru/articles/1026752/ , а Starlink успешно решает проблему вычислительной мощности на конечно устройстве.


      1. malyazin_2010 Автор
        01.06.2026 03:52

        По сути да, Visual Positioning System из Pokémon Go использует тот же стек технологий: фотограмметрия+распознавание.

        Разница в том, что они занимаются неподвижными обьектами (архитектурой), а мы занимаемся подвижными обьектами.

        Когда обьект изучения разный, результаты соответственно получаются разные.


  1. malyazin_2010 Автор
    01.06.2026 03:52

    Использование GPU 3060ti вместо CPU позволило увелмчить скорость вычислений примерно в 60 раз.

    То есть вместо 5 минут на определение координат одной фотографии уходит около 5 сек. Это все равно в 150 раз медленнее, чем нужно для обработки видео в 30 к/сек.