Компания Waymo открыла в общий доступ и только для некоммерческого использования большой датасет, предназначенный для обучения алгоритмов беспилотных автомобилей.

Датасет «Waymo Open Dataset» содержит в себе тысячу двадцатисекундных записей, собранных с пяти лидаров и пяти камер во время реальных поездок по четырем американским городам с разными дорожными и погодными условиями, как пояснено в блоге компании.

Большая часть данных в датасете маркирована и содержит в себе суммарно о 12 млн. 3D меток и 1,2 млн. 2D меток различных объектов вокруг автомобиля.

Компания Waymo считается одним из лидеров в отрасли беспилотных автомобилей. Данные являются важным компонентом для машинного обучения в работе Waymo.

Беспилотные автомобили Waymo уже проехали более 10 млн. миль в двадцати пяти городах США. Этот богатый и разнообразный опыт, накопленный в реальном мире, помог инженерам и исследователям компании разработать и модернизировать беспилотные инновационные модели и алгоритмы.

Теперь Waymo открывает для исследователей специально подготовленный датасет на основе данных датчиков высокого разрешения, собранных беспилотными автомобилями Waymo во время тестовых поездок по американским городам, расположенным в штатах Калифорния, Аризона и Вашингтон.



Датасет собран на основе тысячи поездок, различающихся между собой погодой, временем суток, количеством пешеходов и автомобилей вокруг, а также многими другими факторами.

Из каждой поездки разработчики Waymo выбрали наиболее репрезентативный фрагмент длиной 20 секунд.



Данные, собранные из каждой поездки состоят из видеороликов с пяти камер и облаков точек с пяти лидаров (одного лидара дальнего действия и четырех лидаров ближнего действия). Для удобства дальнейшей обработки алгоритмами все данные датасета синхронизированы и сформированы в виде единых пакетов данных за каждые 0,1 секунды поездки.



Данные датасета размечены и на них нанесены границы вокруг объектов четырех главных типов: автомобили, пешеходы, велосипедисты и дорожные знаки. При этом пока размечены только все данные с лидаров, а с камер размечено только сто роликов.

В будущем Waymo планирует доразметить все данные с камер, а также опубликовать данные с новых поездок.

Этот открытый датасет только первый шаг для Waymo, где ожидают обратной связи от его исследователей о том, как сделать эти данных еще более эффективными в новых следующих открытых датасетах.

Комментарии (3)


  1. defecator
    23.08.2019 09:51

    больше терабайта, ёмаё!


  1. GiperBober
    23.08.2019 10:05

    Ммм… У меня давно крутилась в голове идея насчёт всех этих автопилотов, но я никак не мог подобрать сравнения, чтобы её сформировать доступно. И тут наконец аналогия вспомнилась — это же всё уже было в играх! А именно — как заставить неписей прокладывать маршруты и не застревать? Вариантов, собственно, два — или делать умных ботов, чтобы они могли адекватно распознавать препятствия (но всё равно казусы случаются), либо — повторять маршрут, проложенный человеком.
    Это я всё к чему? К тому, что одной из проблем скорейшего внедрения автопилотов является высокая стоимость оборудования — датчики и системы псевдоИИ, способные распознавать ситуации и реагировать на них. Причём каждый автопроизводитель/разработчик работает сам по себе и в режиме конкуренции и при слабой поддержке властей стран. А если бы задача массового внедрения автопилотов решалась повсеместно как автопроизводителями, так и властями, в том числе — в глобальном масштабе, то можно было бы пойти по тому же менее затратному и быстрому пути. Смысл в следующем — большинство водителей большую часть времени ездят по одним и тем же маршрутам. Так вот, первый раз водитель (либо специально аккредитованный человек от муниципалитета) «показывает» автопилоту маршрут, обозначая ему знаки, светофоры, разметку, ямы на дорогах, и прочие нюансы. Потом уже автопилот ездит по маршруту сам. Лучше, конешно, чтобы МЕСТНЫЕ программы-маршруты составляли местные чиновники, единые для всех автомобилей (с поправкой на габариты и ТТХ), но это потребует конечной настройки каждого маршрута чиновником. А с другой стороны, настройка маршрута самим водителем-владельцем ТС приведёт к разному поведению различных автопилотов. Поэтому решением данной проблемы могло бы стать создание специальных «маршрутных» автомобилей — с типовыми габаритами для различных видов ТС. Например, имеется какой-нибудь типовой провинциальный городок, и сначала специальные «маршрутчики» целый год ездят по этому городу, формируя универсальную карту маршрутов, которую потом загружают в транспортные средства водителей. Карта должна во-первых, быть всегда актуальной (т.е. маршрутчики должны будут кататься и после формирования карты, для постоянной актуализации, и машины должны иметь систему онлайн актуализации карт), во-вторых, иметь возможность локального отключения части улиц в связи, с например, ремонтными работами, авариями или тому подобными неучтёнными в маршрутах препятствиями временного характера. Тогда будет или прокладка маршрута по обходному пути, или предупреждение «на данном участке пути автопилот отключён, возьмите управление на себя, или ТС будет остановлено и припарковано». Разумеется, минимальные автономные функции автопилота не должны зависеть от маршрутной карты — способность останавливаться перед препятствием, распознавать сигналы светофора, контролировать расстояние до впереди идущей машины и соседних машин перед перестроением.
    А то, что я вижу сейчас в плане гонки автопроизводителей (и не только), чуется, может породить хаос, когда в городе автопилотных машин станет достаточное количество, чтобы они начали мешать уже друг другу — в первую очередь из-за наложения работы множества лидаров/сонаров и провоцирования цепных реакций из-за неверного распознавания ситуации каким-либо отдельным автопилотным автомобилем.


    1. vedenin1980
      23.08.2019 11:02

      «показывает» автопилоту маршрут, обозначая ему знаки, светофоры, разметку, ямы на дорогах, и прочие нюансы.

      Это как раз меньшая из проблем, у современных навигаторах много детальной информации. Занести в карту характеристики дороги и все знаки, которые там действуют — вообще не проблема, просто на компе госадминистрации. Найти сфетофоры и разметку — для задачи машинного зрения относительно просто.

      Основная проблема в том, что на дороге есть другие машины, велосипедисты и пешеходы. Поэтому ситуация постоянно меняется, на пустой дороге любой начинающий водитель хоть как-то, но проедет. А вот задачи
      «успею выехать из второстепенной дороге или обогнать по встречке» — куда сложнее, а «предсказать, что чудак с соседней полосы сейчас начнет перестраиваться тебе в бок, не включая поворотников и не смотря на зеркала» — не каждому опытному водителю по плечу.

      плане гонки автопроизводителей

      Конкуренция это обычно хорошо, иначе они могли сделать некоторое стабильное, но не оптимальное совместное решение, и успокоились бы.