Автономный транспорт давно вышел за пределы закрытых полигонов и футуристичных историй. Он уже работает и приносит пользу бизнесу и людям. В России тягачи Navio два года возят реальные грузы коммерческих клиентов по трассе М-11 «Нева». А в США, Китае или Европе можно совершить поездку на роботакси. Тем не менее, восприятие технологии остается противоречивым. Видео, где автомобиль без водителя в салоне не может выехать с кольцевого перекрестка или воспринимает человека в майке с надписью STOP как команду к действию, усиливают скепсис и снижают доверие к результатам разработчиков. Почему компании, которые работают над технологией с 2009 года [больше 15 лет], не смогли добиться ее стабильной работы.
Классический подход в разработке автономного транспорта
Алгоритмический подход признан классическим в разработке автономного транспорта. Логическая архитектура построена на основе последовательности действий водителя за рулем:
- восприятие окружающего мира — набор сенсоров (радары, лидары, камеры); 
- определение местоположения — карты, модуль позиционирования, сенсоры; 
- предсказывание действий других объектов вокруг — алгоритмы на базе кинематической составляющей и модели динамики объектов; 
- планирования пути — руководство к действию или свод правил, основанный на правилах дорожного движения (ПДД); 
- управление — модуль внутри автомобиля приводит его в движение. 
Этот код пишется 15 лет и никогда не будет завершен
Несовершенность классического подхода обнаружилась на этапе планирования пути. При алгоритмическом подходе условия прописываются вручную (what-if сценарии). Автономное транспортное средство принимает решение на основе типа объекта (автомобиль, пешеход, др.), дальше добавляются такие условия, как состояние дорожного покрытия, погода, светофоры, другие объекты. Все это ведет к экспоненциальному росту проверок вложенных условий. Обладая достаточным парком автомобилей, за несколько лет разработчик может закрыть самые часто встречающиеся сценарии на дороге. Следующие несколько лет проездов выловят более редкие случаи и укрепят базу. Но остается открытым вопрос, что делать с уникальными ситуациями, как человек в футболке с надписью STOP или объездом препятствия в месте, где обгон запрещен разметкой. Невозможно вручную прописать все условия заранее, мир сегодня слишком непредсказуем. Такой подход не позволит масштабировать технологию и обеспечить ее стабильность на 100%, особенно в условиях города. Такая бесконечность сценариев называется Long Tail.

Но за ней стоит более глобальная задача — в алгоритмическом подходе в момент принятия решения внутри вычислителя происходит поиск «шаблона» по совпадению условий. Для того, чтобы перестать «догонять» сценарии, нужна принципиально другая технология.
NavioSim догонит ускользающий хвост сценариев
В Navio мы создаем Physical AI. 2025-й стал для нас годом технологической трансформации. Мы перешли к принципиально новому подходу — внедрили генеративный искусственный интеллект (GenAI) и разработали фотореалистичный симулятор. Один из ключевых инструментов, который поможет нам двигаться дальше — быстро и безопасно.

В NavioSim можно воспроизводить сложные, опасные или редкие сценарии в безопасной виртуальной среде. Технология основана на синтезе генеративных моделей и движка фотореалистичного рендера Navio. Симулятор умеет моделировать улицы разных городов, агентов движения и их траекторию, погоду, время дня и человека в футболке с надписью STOP.
NavioSim способен создавать сцены с высокой степенью детализации, идентичные действительности. Таким образом, мы можем проактивно обучать модель на сценариях, встреча с которыми в реальной жизни близка к нулю, но все же не исключена (например, лобовое столкновение). Благодаря технологии фотореалистичного симулятора мы в разы ускорим сбор датасета и заполним все необходимые сегменты навыков вождения нашего AI-водителя. В будущем он также позволит быстро масштабировать технологию и запускаться в любой новой локации.
VLA станет новым стандартом индустрии
Мы приближаемся к этапу, когда автономный транспорт сможет не просто следовать по маршруту, а понимать окружающий мир. Ключевую роль здесь играют VLA-модели (Vision-Language-Action). В отличие от классических алгоритмов, которые решают отдельные задачи, модель позволяет объединять восприятие, прогноз и принятие решений в единую систему. VLA переводит сложный поток данных с камер, радаров и лидаров в понятное описание ситуации: что происходит на дороге, какие объекты рядом и как они могут себя вести. То есть модель видит картину целиком, связывает ее с контекстом и способна интерпретировать их смысл, как человек.
Представьте, что впереди автомобиля дорожно-ремонтные работы: вместо привычных разметки и знаков появляются временные ограждения и жесты рабочего, указывающего путь. VLA распознает эти объекты, анализирует их поведение в контексте движения и выбирает корректную траекторию. Такой подход позволяет адаптироваться к новым сценариям в моменте и применять накопленный опыт в нестандартных ситуациях.
Таким образом, интеграция VLA позволит автономному транспорту уверенно действовать в любых условиях и быстро масштабироваться. Это новый тренд в отрасли и следующий переломный момент эволюции Physical AI компании Navio.
 
           
 
Zara6502
я вожу машину 20 лет и часто впереди вообще непонятно куда ехать, потому что временную разметку делают люди с тремя классами образования, а чтобы сломать ИИ достаточно на знаке написать слово из трёх букв и это уже не знак вовсе.
так что все ИИ которые можно было бы сосредоточить на транспорте - это междугородние перевозки на выделенных трассах. Но перевозка грузов автомашинами это бред из 1950-х и "особенность" США, в любой нормальной стране стремятся грузы перевозить на жд транспорте, вот его и можно ставить на "рельсы" ИИ, но у японцев (да и китайцев думаю), с этим уже давно всё хорошо.
Вообще автомобильный транспорт в мегаполисах нужно убирать совсем, делать монорельс с индивидуальными вагонетками, а дорожную инфраструктуру оставлять для самокатов и автономных такси/автобусов и беспилотного транспорта с доставкой грузов.