Привет. В конце прошлого года мы стали автоматически скрывать номера автомобилей на фотографиях в карточках объявлений на Авито. О том, зачем мы это сделали, и какие есть способы решения таких задач, читайте в статье.
На Авито за 2018 год было продано 2,5 миллиона автомобилей. Это почти 7000 в день. Всем объявлениям о продаже нужна иллюстрация — фото автомобиля. Но по государственному номеру на нём можно найти много дополнительной информации о машине. И некоторые наши пользователи стараются самостоятельно закрывать госномер.
Причины, почему пользователи хотят скрывать госномер, могут быть разными. Со своей стороны мы хотим помогать им защищать свои данные. И стараемся улучшать процессы продажи и покупки для пользователей. Например, у нас уже давно работает услуга анонимного номера: когда вы продаёте автомобиль, для вас создается временный сотовый номер. Ну а чтобы защитить данные о госномерах, мы обезличиваем фотографии.
Чтобы автоматизировать процесс защиты пользовательских фотографий, можно воспользоваться сверточными нейронными сетями для детектирования полигона с номерным знаком.
Сейчас для детекции объектов используются архитектуры двух групп: двухэтапные сети, например, Faster RCNN и Mask RCNN; одноэтапные (singleshot) — SSD, YOLO, RetinaNet. Детектированием объекта является вывод четырёх координат прямоугольника, в которые вписан объект интереса.
Упомянутые выше сети способны находить на картинках множество объектов разных классов, что уже является избыточным для решения задачи поиска номерного знака, потому что машина у нас на картинках, как правило, всего одна (бывают исключения, когда люди фотографируют свою продаваемую машину и её случайную соседку, но это происходит достаточно редко, поэтому этим можно было пренебречь).
Ещё одна особенность этих сетей состоит в том, что по умолчанию они выдают bounding box со сторонами, параллельными осям координат. Это происходит так, потому что для детектирования используется набор заранее определённых видов прямоугольных рамок, называемых anchor boxes. Если точнее, то сначала с помощью какой-то сверточной сети (например resnet34) из картинки получают матрицу признаков. Потом для каждого подмножества признаков, полученного с помощью скользящего окна, происходит классификация: есть или нет объект для k anchor box и проводится регрессия в четыре координаты рамки, которые корректируют её положение.
Подробнее об этом можно прочитать здесь.
После этого есть ещё две головы:
одна для классификации объекта (собака/кошка/растение и т.д),
вторая (bbox regressor) — для регрессии координат рамки, полученной на предыдущем шаге, чтобы увеличить соотношение площади объекта к площади рамки.
Для того, чтобы предсказать повернутую рамку бокса, нужно изменить bbox regressor так, чтобы получать ещё и угол поворота рамки. Если этого не делать, то получится как-то так.
Кроме двухэтапного Faster R-CNN, есть одноэтапные детекторы, например RetinaNet. Он отличается от предыдущей архитектуры тем, что сразу предсказывает класс и рамку, без предварительного этапа предложения участков картинки, которые могут содержать объекты. Для того чтобы предсказывать повернутые маски, нужно также изменить голову box subnet.
Один из примеров существующих архитектур для предсказания повернутых bounding box — DRBOX. Эта сеть не использует предварительный этап предложения региона, как в Faster RCNN, поэтому она является модификацией одноэтапных методов. Для обучения этой сети используется K повернутых под определенными углами bounding box (rbox). Сеть предсказывает вероятности для каждого из K rbox содержать таргет объект, координаты, размер bbox и угол поворота.
Модифицировать архитектуру и заново обучить одну из рассмотренных сетей на данных с повернутыми bounding boxes — задача реализуемая. Но нашу цель можно достигнуть проще, ведь область применения сети у нас гораздо уже — только для скрытия номерных знаков.
Поэтому мы решили начать с простой сети для предсказания четырёх точек номера, впоследствии можно будет усложнить архитектуру.
Сборка датасета разбивается на два шага: собрать картинки автомобилей и разметить на них область с госномером. Первая задача уже решена в нашей инфраструктуре: все объявления, которые были когда-либо размещены на Авито, мы аккуратно храним. Для решения второй задачи мы используем Толоку. На toloka.yandex.ru/requester создаём задание:
С помощью Толоки можно создавать задания по разметке данных. Например, оценивать качество поисковой выдачи, размечать разные классы объектов (текстов и картинок), размечать видео и т.д. Их будут выполнять пользователи Толоки, за плату, которую вы назначите. Например, в нашем случае толокеры должны выделить полигон с госномером автомобиля на фото. В целом это очень удобно для разметки большого датасета, но получить высокое качество довольно сложно. На толоке много ботов, задачей которых является получить с вас деньги, наставив ответы рандомно или с помощью какой-то стратегии. Для противодействия этим ботам есть система правил и проверок. Основной проверкой является подмешивание контрольных вопросов: вы размечаете вручную часть заданий, пользуясь интерфейсом Толоки, а далее подмешиваете их в основное задание. Если размечающий часто ошибается на контрольных вопросах, вы его блокируете и разметку не учитываете.
Для задачи классификации очень просто определить, ошибся размечающий или нет, а для задачи выделения области это не так просто. Классический способ — считать IoU.
Если это отношение меньше некоторого заданного порога для нескольких заданий, то такой пользователь блокируется. Однако для двух произвольных четырехугольников посчитать IoU не так просто, тем более, что в Толоке приходится это реализовать на JavaScript. Мы сделали небольшой хак, и считаем, что пользователь не ошибся, если для каждой точки исходного полигона в небольшой окрестности находится точка, отмеченная разметчиком. Ещё есть правило быстрых ответов, чтобы блокировались слишком быстро отвечающие пользователи, капча, расхождение с мнением большинства и т.д. Настроив эти правила, можно ожидать довольно неплохую разметку, но если нужно действительно высокое качество и сложная разметка, нужно специально нанимать фрилансеров-разметчиков. В итоге наш датасет составил 4к размеченных картинок, и стоило всё это 28$ на Толоке.
Теперь сделаем сеть для предсказания четырёх точек области. Получим признаки с помощью resnet18 (11.7M параметров против 21.8M параметров у resnet34), далее делаем голову для регрессии в четыре точки (восемь координат) и голову для классификации, есть на картинке номерной знак или нет. Вторая голова нужна, потому что в объявлениях о продаже машины не все фотографии с машинами. На фото может быть деталь автомобиля.
Подобное нам, конечно, детектить не надо.
Обучение двух голов делаем одновременно, добавив в датасет фото без номерного знака с таргетом bounding box (0,0,0,0,0,0,0,0) и значением для классификатора «картинка с номерным знаком / без» — (0,1).
Тогда можно составить единую лосс функцию для обеих голов как cумму следующих лоссов. Для регрессии в координаты полигона номерного знака используем гладкий L1 loss.
Его можно интерпретировать как комбинацию L1 и L2, который ведёт себя как L1, когда абсолютное значение аргумента велико и как L2, когда значение аргумента близко к нулю. Для классификации используем softmax и crossentropy loss. Экстрактор признаков — resnet18, используем веса, предобученные на ImageNet, дальше дообучаем на нашем датасете экстрактор и головы. В данной задаче мы использовали фреймворк mxnet, так как он является основным для computer vision в Авито. Вообще, микросервисная архитектура позволяет не привязываться к конкретному фреймворку, но когда имеешь большую кодовую базу, лучше использовать ее и не писать тот же самый код заново.
Получив приемлемое качество на нашем датасете, мы обратились к дизайнерам, чтобы нам сделали номерной знак с логотипом Авито. Сначала мы конечно попробовали сделать сами, но выглядел он не очень красиво. Дальше требуется изменить яркость номерного знака Авито на яркость оригинальной области с номерным знаком и можно накладывать логотип на изображение.
Проблема воспроизводимости результатов, поддержки и развития проектов, решённая с некоторой погрешностью в мире backend- и frontend-разработки, всё ещё стоит открытой там, где требуется использовать модели машинного обучения. Вам наверняка приходилось разбираться в легаси коде моделек. Хорошо если в readme есть ссылки на статьи или опенсорс-репозитории, на которых базировалось решение. Скрипт для запуска переобучения может упасть с ошибками, например, поменялась версия cudnn, и та версия tensorflow уже не работает с этой версией cudnn, а cudnn не работает с этой версией драйверов nvidia. Может, для обучения использовался один итератор по данным, а для тестирования и в продакшене другой. Так можно продолжать довольно долго. В общем, проблемы с воспроизводимостью существуют.
Мы стараемся убрать их, используя nvidia-docker окружение для обучения моделек, в нём есть все необходимые зависимости для сuda, также туда устанавливаем зависимости для питона. Версия библиотеки с итератором по данным, аугментациями, инференсу моделек — общая для стадии обучения/экспериментирования и для продакшена. Таким образом, чтобы дообучить модель на новых данных, вам нужно выкачать репозиторий на сервер, запустить shell скрипт, который соберет докер-окружение, внутри которого поднимется jupyter notebook. Внутри у вас будут все notebook’и для обучения и тестирования, которые точно не упадут с ошибкой из-за окружения. Лучше, конечно, иметь один файл train.py, но практика показывает, что всегда требуется смотреть глазами на то, что выдаёт моделька и что-то менять в процессе обучения, так что в конце вы всё равно запустите jupyter.
Веса модели хранятся в git lfs — это специальная технология для хранения больших файлов в гите.До этого мы пользовались артифактори, но через git lfs удобнее, потому что скачивая репозиторий с сервисом, вы сразу получаете актуальную версию весов, как на продакшене. Для инференса моделей написаны автотесты, так что не получится раскатить сервис с весами, которые их не проходят. Сам сервис запускается в докере внутри микросервисной инфраструктуры на кластере kubernetes. Для мониторинга производительности мы используем grafana. После раскатки мы постепенно увеличиваем нагрузку на инстансы сервисов с новой моделькой. При выкатке новой фичи мы создаем а/б тесты и выносим вердикт по дальнейшей судьбе фичи, опираясь на статистические тесты.
В результате: мы запустили замазывание номеров на объявлениях в категории авто для частников, 95 перцентиль времени обработки одной картинки для скрытия номера равен 250 мс.
Задача
На Авито за 2018 год было продано 2,5 миллиона автомобилей. Это почти 7000 в день. Всем объявлениям о продаже нужна иллюстрация — фото автомобиля. Но по государственному номеру на нём можно найти много дополнительной информации о машине. И некоторые наши пользователи стараются самостоятельно закрывать госномер.
Причины, почему пользователи хотят скрывать госномер, могут быть разными. Со своей стороны мы хотим помогать им защищать свои данные. И стараемся улучшать процессы продажи и покупки для пользователей. Например, у нас уже давно работает услуга анонимного номера: когда вы продаёте автомобиль, для вас создается временный сотовый номер. Ну а чтобы защитить данные о госномерах, мы обезличиваем фотографии.
Обзор способов решения
Чтобы автоматизировать процесс защиты пользовательских фотографий, можно воспользоваться сверточными нейронными сетями для детектирования полигона с номерным знаком.
Сейчас для детекции объектов используются архитектуры двух групп: двухэтапные сети, например, Faster RCNN и Mask RCNN; одноэтапные (singleshot) — SSD, YOLO, RetinaNet. Детектированием объекта является вывод четырёх координат прямоугольника, в которые вписан объект интереса.
Упомянутые выше сети способны находить на картинках множество объектов разных классов, что уже является избыточным для решения задачи поиска номерного знака, потому что машина у нас на картинках, как правило, всего одна (бывают исключения, когда люди фотографируют свою продаваемую машину и её случайную соседку, но это происходит достаточно редко, поэтому этим можно было пренебречь).
Ещё одна особенность этих сетей состоит в том, что по умолчанию они выдают bounding box со сторонами, параллельными осям координат. Это происходит так, потому что для детектирования используется набор заранее определённых видов прямоугольных рамок, называемых anchor boxes. Если точнее, то сначала с помощью какой-то сверточной сети (например resnet34) из картинки получают матрицу признаков. Потом для каждого подмножества признаков, полученного с помощью скользящего окна, происходит классификация: есть или нет объект для k anchor box и проводится регрессия в четыре координаты рамки, которые корректируют её положение.
Подробнее об этом можно прочитать здесь.
После этого есть ещё две головы:
одна для классификации объекта (собака/кошка/растение и т.д),
вторая (bbox regressor) — для регрессии координат рамки, полученной на предыдущем шаге, чтобы увеличить соотношение площади объекта к площади рамки.
Для того, чтобы предсказать повернутую рамку бокса, нужно изменить bbox regressor так, чтобы получать ещё и угол поворота рамки. Если этого не делать, то получится как-то так.
Кроме двухэтапного Faster R-CNN, есть одноэтапные детекторы, например RetinaNet. Он отличается от предыдущей архитектуры тем, что сразу предсказывает класс и рамку, без предварительного этапа предложения участков картинки, которые могут содержать объекты. Для того чтобы предсказывать повернутые маски, нужно также изменить голову box subnet.
Один из примеров существующих архитектур для предсказания повернутых bounding box — DRBOX. Эта сеть не использует предварительный этап предложения региона, как в Faster RCNN, поэтому она является модификацией одноэтапных методов. Для обучения этой сети используется K повернутых под определенными углами bounding box (rbox). Сеть предсказывает вероятности для каждого из K rbox содержать таргет объект, координаты, размер bbox и угол поворота.
Модифицировать архитектуру и заново обучить одну из рассмотренных сетей на данных с повернутыми bounding boxes — задача реализуемая. Но нашу цель можно достигнуть проще, ведь область применения сети у нас гораздо уже — только для скрытия номерных знаков.
Поэтому мы решили начать с простой сети для предсказания четырёх точек номера, впоследствии можно будет усложнить архитектуру.
Данные
Сборка датасета разбивается на два шага: собрать картинки автомобилей и разметить на них область с госномером. Первая задача уже решена в нашей инфраструктуре: все объявления, которые были когда-либо размещены на Авито, мы аккуратно храним. Для решения второй задачи мы используем Толоку. На toloka.yandex.ru/requester создаём задание:
В задании дана фотография автомобиля. Необходимо выделить номерной знак автомобиля, используя для этого четырёхугольник. При этом следует выделять государственный номер максимально точно.
С помощью Толоки можно создавать задания по разметке данных. Например, оценивать качество поисковой выдачи, размечать разные классы объектов (текстов и картинок), размечать видео и т.д. Их будут выполнять пользователи Толоки, за плату, которую вы назначите. Например, в нашем случае толокеры должны выделить полигон с госномером автомобиля на фото. В целом это очень удобно для разметки большого датасета, но получить высокое качество довольно сложно. На толоке много ботов, задачей которых является получить с вас деньги, наставив ответы рандомно или с помощью какой-то стратегии. Для противодействия этим ботам есть система правил и проверок. Основной проверкой является подмешивание контрольных вопросов: вы размечаете вручную часть заданий, пользуясь интерфейсом Толоки, а далее подмешиваете их в основное задание. Если размечающий часто ошибается на контрольных вопросах, вы его блокируете и разметку не учитываете.
Для задачи классификации очень просто определить, ошибся размечающий или нет, а для задачи выделения области это не так просто. Классический способ — считать IoU.
Если это отношение меньше некоторого заданного порога для нескольких заданий, то такой пользователь блокируется. Однако для двух произвольных четырехугольников посчитать IoU не так просто, тем более, что в Толоке приходится это реализовать на JavaScript. Мы сделали небольшой хак, и считаем, что пользователь не ошибся, если для каждой точки исходного полигона в небольшой окрестности находится точка, отмеченная разметчиком. Ещё есть правило быстрых ответов, чтобы блокировались слишком быстро отвечающие пользователи, капча, расхождение с мнением большинства и т.д. Настроив эти правила, можно ожидать довольно неплохую разметку, но если нужно действительно высокое качество и сложная разметка, нужно специально нанимать фрилансеров-разметчиков. В итоге наш датасет составил 4к размеченных картинок, и стоило всё это 28$ на Толоке.
Модель
Теперь сделаем сеть для предсказания четырёх точек области. Получим признаки с помощью resnet18 (11.7M параметров против 21.8M параметров у resnet34), далее делаем голову для регрессии в четыре точки (восемь координат) и голову для классификации, есть на картинке номерной знак или нет. Вторая голова нужна, потому что в объявлениях о продаже машины не все фотографии с машинами. На фото может быть деталь автомобиля.
Подобное нам, конечно, детектить не надо.
Обучение двух голов делаем одновременно, добавив в датасет фото без номерного знака с таргетом bounding box (0,0,0,0,0,0,0,0) и значением для классификатора «картинка с номерным знаком / без» — (0,1).
Тогда можно составить единую лосс функцию для обеих голов как cумму следующих лоссов. Для регрессии в координаты полигона номерного знака используем гладкий L1 loss.
Его можно интерпретировать как комбинацию L1 и L2, который ведёт себя как L1, когда абсолютное значение аргумента велико и как L2, когда значение аргумента близко к нулю. Для классификации используем softmax и crossentropy loss. Экстрактор признаков — resnet18, используем веса, предобученные на ImageNet, дальше дообучаем на нашем датасете экстрактор и головы. В данной задаче мы использовали фреймворк mxnet, так как он является основным для computer vision в Авито. Вообще, микросервисная архитектура позволяет не привязываться к конкретному фреймворку, но когда имеешь большую кодовую базу, лучше использовать ее и не писать тот же самый код заново.
Получив приемлемое качество на нашем датасете, мы обратились к дизайнерам, чтобы нам сделали номерной знак с логотипом Авито. Сначала мы конечно попробовали сделать сами, но выглядел он не очень красиво. Дальше требуется изменить яркость номерного знака Авито на яркость оригинальной области с номерным знаком и можно накладывать логотип на изображение.
Запуск в прод
Проблема воспроизводимости результатов, поддержки и развития проектов, решённая с некоторой погрешностью в мире backend- и frontend-разработки, всё ещё стоит открытой там, где требуется использовать модели машинного обучения. Вам наверняка приходилось разбираться в легаси коде моделек. Хорошо если в readme есть ссылки на статьи или опенсорс-репозитории, на которых базировалось решение. Скрипт для запуска переобучения может упасть с ошибками, например, поменялась версия cudnn, и та версия tensorflow уже не работает с этой версией cudnn, а cudnn не работает с этой версией драйверов nvidia. Может, для обучения использовался один итератор по данным, а для тестирования и в продакшене другой. Так можно продолжать довольно долго. В общем, проблемы с воспроизводимостью существуют.
Мы стараемся убрать их, используя nvidia-docker окружение для обучения моделек, в нём есть все необходимые зависимости для сuda, также туда устанавливаем зависимости для питона. Версия библиотеки с итератором по данным, аугментациями, инференсу моделек — общая для стадии обучения/экспериментирования и для продакшена. Таким образом, чтобы дообучить модель на новых данных, вам нужно выкачать репозиторий на сервер, запустить shell скрипт, который соберет докер-окружение, внутри которого поднимется jupyter notebook. Внутри у вас будут все notebook’и для обучения и тестирования, которые точно не упадут с ошибкой из-за окружения. Лучше, конечно, иметь один файл train.py, но практика показывает, что всегда требуется смотреть глазами на то, что выдаёт моделька и что-то менять в процессе обучения, так что в конце вы всё равно запустите jupyter.
Веса модели хранятся в git lfs — это специальная технология для хранения больших файлов в гите.До этого мы пользовались артифактори, но через git lfs удобнее, потому что скачивая репозиторий с сервисом, вы сразу получаете актуальную версию весов, как на продакшене. Для инференса моделей написаны автотесты, так что не получится раскатить сервис с весами, которые их не проходят. Сам сервис запускается в докере внутри микросервисной инфраструктуры на кластере kubernetes. Для мониторинга производительности мы используем grafana. После раскатки мы постепенно увеличиваем нагрузку на инстансы сервисов с новой моделькой. При выкатке новой фичи мы создаем а/б тесты и выносим вердикт по дальнейшей судьбе фичи, опираясь на статистические тесты.
В результате: мы запустили замазывание номеров на объявлениях в категории авто для частников, 95 перцентиль времени обработки одной картинки для скрытия номера равен 250 мс.
dude_sam
У вас опечатка в разделе ЗАДАЧА.
Должно быть: необходимо продать дополнительный сервис по информации об автомобиле, для этого требуется скрыть гос. номер, чтобы пользователи не смогли самостоятельно найти данные в открытых источниках. ?\_(?)_/?
Cubist
Эм, то есть те пользователи которые самостоятельно скрывали свои гос. номера были заодно с Avito? ?_(?)_/?
Вообще я публикуя своё авто на любом сервисе предпочитаю скрыть номер, а то по нему действительно слишком много всего найти, не только по моей машине, но и по персональным данным.
klim76
Вы наверное и ездите без номерного знака? А то по нему много всякого можно найти
Mikhail_dev
Ой, ну прекратите лукавить. Я понимаю что вы как разработчик авито хвалите своё творение, но давайте на чистоту: скрывают обычно те, кому есть что скрывать. Ну и параноики, либо что называется «на всякий случай».
Вы скрываете номер, который: а) всем доступен на дорогах. б) доступен даже когда мы хотим посмотреть машину. Едем туда, но даже не подходим к авто. Мы можем издали увидеть номер. Так что ваши старания по сути множатся на ноль для тех, кому вдруг действительно понадобился ваш номер.
P.S. для меня люди, которые скрывают номер и VIN уже по умолчанию являются подозрительными личностями, и им я позвоню в последнюю очередь.
P.P.S никогда не скрывал ни номер авто, ни VIN номер при продаже.
0xf0a00
Вы не понимаете, это российский
наебизнес.talbot
Кстати, в Нидерландах номер автомобиля абсолютно публичный и вся информация об автомобиле (но не о владельцах) доступна из открытых источников (сайта RDW, местной ГАИ), включая всю историю машины. И да, на местном Авито (Marktplaats, часть eBay) номера всегда видны. Так что инициатива Авито очень странная и попахивает сделками с мошенниками, которые продают машины с неизвестной историей.
Ernest88
В Эстонии кстати тоже по номеру можно найти много информации о машине, но не о владельце. Пробег скрутить проблемотично, так как он фиксируется каждый год на техосмотре и поддается поиску. А вот частным парковкам, например, найти информацию о владельце машины непросто. От того многие просто перестали оплачивать их штрафы, оставленные под дворником.
burzooom
LazyTalent
На многих европейских аукционах, номер не только на фото видно, а еще есть поля на сайте для номера и VIN.
grafdezimal
Может таки причина в том, что в Нидерландах номер «принадлежит» машине, а не владельцу? Т.е. он не меняется при продаже и вообще в жизни машины, такой второй VIN типа.
Вот в Германии настоятельного рекомендуют номер в объявлениях затирать. Иначе можно нарваться на мошенничество со страховкой.
Cubist
Пользователь всегда может просто написать/позвонить продавцу и спросить номер. И
VIMVIN.pashkov
Это всё дополнительные барьеры при анализе авто.
GLeBaTi
Так и не ясно для чего скрывать номера. Мошенники как-то могут воспользоваться этой информацией?
Cubist
Могут воспользоваться. По ним можно узнать и имя собственника, контакты и место проживания, паспортные данные и тд.
wanomgn
а то что я номер просто на улице вижу? точно так же все выясню ;-)
опишите пожалуйста подробно как мошенник воспользуется номером с фотографии?
Anton23
Например, найти его по ФИО на авито. Найти объявление с номером. По номеру вычислить телефон, и еще очень многое(некоторые говорят, что вплоть до прописки).
Loki3000
А можно съездить на осмотр машины и получить все эти данные прямо от владельца, даже не пробивая по номеру.
Anton23
Да уж, особенно весело ехать в другой город. Да еще и деанонимизировать свою личность(дела то точно противоправные будут совершаться). Ну и объявление просто напросто может быть закрыто.
Loki3000
Много кто приезжает машины смотреть и все обязательно проверяют документы. Так что под подозрением будет куча народу. Да и ваши паспортные данные можно из кучи мест дернуть, так что количество подозреваемых просто фантастическое на самом деле.
wanomgn
мы про разные авито говорим?? какое такое ФИО на авито?
vanyas
Зачем выяснять телефон по номеру машины, если он и так написан в объявлении?
Regis
В объявлении может быть указан временный виртуальный номер, а не настоящий номер владельца.
Anton23
Упс, неувязочка)
razielvamp
Почему надо пробивать эту инфу именно по объявлению из Авито, вместо того, чтобы найти такую же машину в соседнем дворе и пробить инфу на неё?
На поверхности лежит два факта:
Объявление в Авито дает нам дополнительную информацию, что машина продается. Случайная машина со двора может и не продаваться.
Еще, как вариант, машины из Авито можно сканировать ботом, а реальные авто со двора надо обходить физически самостоятельно.
Но я не понимаю как два вышеупомянутых «преимущества» могут использовать мошенники?
А что касается статьи, то я зашел почитать про «Для чего» — прочитав по диагонали, внятного ответа не нашел.
agp88
Наверняка можно тучу способов придумать, как это использовать.
Один из возможных сценариев: злоумышленник, видя номер продаваемого автомобиля на сайте получает следующую информацию: имя-фамилия-адрес владельца, а также то, что владалец в скором времени станет обладателем кругленькой суммы. Дальше дело техники: устанавливаем слежку за владельцем, как только он продаёт машину (это можно установить как явно, став свидетелем передачи авто, так и по косвеным признакам: авто пропало с парковки перед домом, например), подкарауливаем его в уромном месте и «уговариваем» делиться. Да, сложно, да, попахивает паранойей в терминальной стадии, но вероятность того, что кто-то может попытаться воплотить его в жизнь, особенно с учётом того, что речь может идти о довольно приличных суммах, как мне кажется, не равна нулю.
wanomgn
ну то-есть реальных причин нет ни одной… все сводится к принципу «как бы чего не вышло»
agp88
Честно говоря, странный ответ. Да, как бы чего не вышло. Простая предосторожность, из таких предосторожностей наша жизнь и состоит. Нет реальных причин не запирать входную дверь, когда уходишь на работу, ведь порядочные люди даже не подумают вашу дверь открывать. Нет реальных причин смотреть по сторонам, когда идёшь на зеленый, ведь водители обязаны соблюдать ПДД. Нет реальных причин не светить крупной суммой денег в злачных местах, ведь порядочные люди никогда на чужую собственность не позарятся.
Причём, соблюдение этих предосторожностей почти ничего не стоит, а несоблюдение может очень-очень сильно испортить жизнь. И стоит ли оно того?
Loki3000
А теперь посмотрите на вопрос со стороны покупателя: скрытый номер не позволяет проверить автомобиль до очного с ним знакомства. Так что придется верить продавцу на слово ну либо платить деньги авито за предоставление этой информации. Причем, как я понимаю, если заплатить деньги, то авито все равно всю информацию сольет. Так что приплетать сюда безопасность, по меньшей мере, странно.
Endeavour
> Нет реальных причин не запирать входную дверь, когда уходишь на работу, ведь порядочные люди даже не подумают вашу дверь открывать.
Поищите на ютубе видео подбора замков, их там полно, люди занимаются этим как спортом. Так что закрытая дверь — это точно такая же подсказка порядочным людям, что сюда заходить не стоит.
Endeavour
Минуса? Забавно, это как голову в песок что ли?
Вместо этого лучше бы глянули видео, например, и озаботились выбором действительно хорошего замка.
valery1707
А какой замок действительно хорош?
burzooom
а как защитить граждан, которые приходят с деньгами к продавцу, а он их отбирает? Охота за продавцами долгая, а вот сделать объявление для вида и ловить на живца — очень быстро и эффективно
BDI
Если не скрывать номер, то есть связка модель-цвет-госномер. А уж как поступать дальше — зависит от фантазии злоумышленника :).
Мошенники изобрели новый способ уклонения от оплаты дорогой московской парковки: находят автомобиль такой же модели и цвета, делают дубликаты номеров — и крепят их на магнитиках лишь на время стоянки. В результате штрафы приходят ни в чём не повинным людям.
Понятно что и в потоке можно найти жертву для клонирования, но согласитесь что на специализированном сайте где можно отфильтровать модель и цвет — сделать это гораздо проще(если предположить что номера с фотографий не трут).
wanomgn
ну и зачем нужна эта связка?
мошенники просто лепят левые номера
парктроны сканируют НОМЕРА и по номеру выставляется штраф за парковку (как раз об этом и написано в приведенной вами статье)
а там уж ты бегай и доказывай что твой номер кто то использовал незаконно
BDI
Вариант с парковкой — первое что нагуглилось. А так есть и другие варианты, с первой страницы поисковой выдачи: поиск машины под угон на заказ, продажа угнанной машины по левым номерам. Всё зависит от воображения.
Понятно что фотографии в интернете не единственный способ набрать таких связок, но зато самый простой и продуктивный(был?). Я при выкладывании фото своего авто в интернете всегда номер затираю(правда через объявления не продавал).
Если честно, на авто.ру(на авито не смотрел машины никогда) мне вообще не попадались продаваемые авто с номерами на фото, изредка VIN может быть в тексте объявления. Точнее так было — зашёл сейчас, завели поля и для VIN, и для госномера. Правда в объявлениях они частично скрыты, по крайней мере без авторизации на сайте. Не знаю дают ли бесплатно посмотреть эти данные авторизованным пользователям, но какая-то проверка VIN там уже есть(если судить по плашкам «VIN проверен»), что позволит отсеять совсем сомнительные варианты. А дальше меня не напряжёт заплатить за подробную информацию(если авто приглянулось). В любом случае, покупать б/у авто без криминалистической экспертизы себе дороже может статься.
Мне кажется что лучший вариант, это давать продавцу поля для указания госномера и VIN, на его усмотрение, а на фотках затирать(не все умеют сами :). Или, как предложили тут ниже по обсуждению, при публикации объявления сделать чекбокс «затирать номера на фото». Т.е. по умолчанию защищаем информацию о номерах(защита невнимательных), но оставляем продавцу удобную возможность указать донести дополнительную информацию до потенциального покупателя.
P.S. Пока писал ответ, подумал что в контексте продажи авто(статья же от авито) выкладывать фото с номерами не так критично — если не планируем оставлять теже номера(правда не уверен, есть ли варианты полноценной покупки с сохранением номеров, или при перерегистрации ТС по любому новые дадут), то после продажи связка протухнет :). А вот в не продажном контексте я бы точно не рекомендовал бы светить номера на весь интернет.
zerg59
Что мне помешает просто повесить рандомный номер? Или взятый из записи своего видеорегистратора? Зачем такие сложности с просмотром объявлений?
BDI
wanomgn о том же пишет. Полагаю вы промахнулись, и вопрос был ко мне :).
Связка нужна чтобы сделать полный дубль авто(не считая VIN). Но в контексте статьи(т.е. продажа авто, а не выкладывание себя на фоне коня в социалочке) это конечно не критично. Скорее отсутствие подробных данных в объявлении снижает привлекательность лота. В общем, я так увлёкся чтением статьи с технической точки зрения, что забыл о контексте применения этой технологии. Полагаю что озвученная в комментариях версия о том что цель замазывания номеров на фото — продать подробные данные заинтересовавшимся автомобилем, с высокой вероятностью верна.
По поводу выкладывания неретушированных фоток вне темы продажи авто я уже высказался — светить или не светить свои данные каждый решает сам. А обсуждать этические стороны желания площадки дополнительно заработать на посетителях я обсуждать не готов, так как не знаю как они монетизируются. Если только за счёт рекламы, то их можно понять — даже выручка за рекламу у телеканалов просела(сегодня на рбк писали), а уж в интернет без блокировщика ходят только ленивые, или принципиальные :).
zerg59
Это уже иная весовая категория. Это не для избегания штрафов за парковку. Это для легализации угнанных/нерастаможенных авто.
BDI
Категория другая, но последствия для владельца оригинального номера примерно теже — чужие штрафы, и их обжалование :(.
P.S. Вы ниже ссылку на habr.com/ru/company/cloud4y/blog/344390 привели — спасибо, интересная информация. Пробил свою первую машину(по трейд-ин махнул в 15-ом) — судя по выдаче на гибдд.рф/check/auto всё ещё бегает, видимо новому хозяину не жалко было на кузовщину потратиться(пол прогнил) :)
bohdan-shulha
> Скорее отсутствие подробных данных в объявлении снижает привлекательность лота
У нас на митапе ребята из Авто.РИА (apelsyn) делились информацией, что так оно и есть.
balsoft
Вы я надеюсь со своего авто скрутили номера, чтобы злоумышленник на улице не увидел связку модель-цвет-номер?
JamboJet
Тогда проще просто ждать у пункта регистрации местного ГИБДД: все посетители продают или покупают автомобили, а значит связаны с крупными суммами денег.
Сиди себе да присматривай одетых побогаче, с лицом попроще.
Kastrulya
Вы в ГИБДД исключительно с условными 500 тысячами рублей ходите?
И туда уже идут без денег, но с покупкой. Если речь про постановку на учет.
egigd
Но вы же можете спокойно проследить за выбранным человеком до его дома…
Endeavour
Я не в курсе как продаются машины, там что, все за наличку? Даже если так, то глупо тащиться с такой суммой домой.
Maximuzz
когда я продавал авто, мы пришли к банкомату и я запихнул всю сумму себе на карту. Плюсы — считает банкомат и выявляет поддельные купюры, не надо ходить с наличкой, из минусов — банк может заблокировать сумму по 115 ФЗ и придется идти с договором в банк (если сумма свыше 600 тыс) и придется указывать всю сумму сделки.
Kastrulya
Можно пасти машину до момента продажи и отобрать деньги. Я слышал про такого рода аргумент.
Nova_Logic
и что мешает так-же смотаться один раз на встречу и пасти?
Kastrulya
А мне откуда знать?
intnzy
Идентифицировать человека, у которого скоро будет много денежек. Как тебе такое, wanomgn? Случайная машина на улице не интересна. А вот человек, который вот-вот проведет сделку и окажется скрупной суммой на руках — возможны варианты, не так ли?
zerg59
Всё просто: есть доп услуга на том же Авито — пробивка истории авто (autoteka). Она платная. И там всё. VIN. История объявлений на Авито. История хозяев (без ФИО) по ПТС. Калькуляции ремонтов итд.
В принципе, зная госномер можно вычислить VIN а дальше много чего узнать бесплатно. Статья об этом на Хабре была.
stepmex
Вы путаете гос. номер и VIN. История авто пробивается по VIN номеру.
Обычный гос номер на своей машине можно поменять, при удачном стечении обстоятельств, в течении суток, и законно!
Идёте в ГиБДД и снимаете машину с учёта, на следующее утро идёте в ГиБДД и ставите машину на учёт с новыми номерами.
Причём услуга сохранения номеров при постановке на учёт появилась не так уж и давно. До этого они менялись всегда когда машину снимали с учёта.
zerg59
Ознакомьтесь: habr.com/ru/company/cloud4y/blog/344390
P.S. Я присматривал машинку в соседнем регионе. По объявлению — последние три года один хозяин. По отчётам — четыре записи в ПТС за указанный период. Продавец говорил, что это из-за смены номеров ;-). В общем всё кончилось тем, что я забросил удочки к знакомым из сервиса — вдруг что подходящее подвернётся. А так — ушёл копить ещё 100к, чтобы искать в менее стрёмном ценовом диапазоне.
stepmex
Даже по вашей ссылке гос. номер нужен что бы найти VIN, и уже по VIN найти историю.
Сколько продал машин или покупал, чаще всего просил/просят, по телефону или смс, сбросить VIN. Если начинают ломаться значит машина «серая».
TOLK
Если я потенциальный мошенник, то позвоню по номеру, и дороворюсь чтобы машину привозили на осмотр, скажу что это госкорпорация и за деньгами вопрос не стоит, можем даже докинуть. Чел сам приедет и покажет номер.
Зато у меня будут дополнительные данные, что чел. + еще доверчив. Можно отсеить недоверчивых )
Sabubu
Конечно, могут. Они могут по номеру найти ваше объявление, и возможно, получить ваш телефон, или информацию о машине, или еще что-то. Вся лишняя информация должна скрываться и быть недоступной для индексирования и составления вредоносных баз данных. Вы ведь хотите продать машину, а не рассказывать всему миру детали своей частной жизни.
Любую вашу информацию можно использовать тремя способами:
— вам во благо. В данном случае я не могу представить такого сценария
— никак не использовать
— вам во вред или в ущерб
Таким образом, скрывая номер, мы минимизируем вероятность последнего пункта. Пусть сетевые шерлоки холмсы проявят чуть больше усилий.
А можно задать встречный вопрос: а вы хотите, чтобы номер и информация о вашей машине выкладывался на всеобщее обозрение, или же вы с какими-то целями хотите иметь информацию о транспортных средствах, которые вам не принадлежат?
klim76
Номер телефона указан в объявлении, номер авто доступен при непосредственном осмотре, где безопасность?
wanomgn
удобно вы расписали: первый пункт значит вы представить не можете
а вот третий легко принимаете на веру и начинаете с ним бороться
ну дык назовите пожалуйста вектор атаки имея номер на фоточке… (причем он должен отличаться от варианта «увидел номер автомобиля на улице»)
я вижу только один — по фотографии украдут душу автомобиля… но там вроде обязательно номер закрывать смайликом (квадратная рамка не защищает от этого) :-)
vasyan
Авито просто хочет продавать информацию о транспортных средствах, которые вам не принадлежат, а не раздавать бесплатно, как auto.ru
Loki3000
Авто ру точно так же поступает. Там тоже все номера автоматически замазываются.
sergeiss
По-моему, после этого камента можно больше ничего не писать, а все остальные каменты удалить :))) Ибо подмечено очень точно.
Sabubu
Да, Авито хочет заработать. Но с точки зрения владельца это все равно плюс, так как раньше (когда номер не замазывался) любой мог собирать и индексировать эти номера, накапливать базы, предоставлять поиск. И просто ввод номера в гугле или на специальном сайте позволил бы найти объявление и информацию о владельце. А теперь гугление уже не поможет случайному человеку найти автомобиль.И базу собрать не получится, так как надо за каждое объявление платить по 197 рублей.
Но, конечно, еще лучше было бы если бы просто задавался срок жизни объявления и оно автоматически скрывалось через 2-3 месяца и информация бы удалялась безвозвратно. Если вы продали машину, или если передумали продавать — какая выгода оставлять эту информацию в открытом доступе?
Сейчас используется неправильный подход, когда компания всеми правдами и неправдами получила данные и может делать с ними что угодно. Надо менять этот подход, чтобы владелец данных оставался бы их владельцем и мог бы в любой момент удалить эти данные (закон о ПД в теории позволяет отозвать согласие, но РКН трактует этот закон, как ему удобно, в одних случаях считая номер телефона не персональными данными, в других — блокирует сайты за гугл аналитику). И закрашивание номеров чуть-чуть позволяет улучшить ситуацию, не давая посторонним сайтам накапливать информацию, которую вы им не давали. Это лучше, чем вообще ничего.
onlinehead
У Auto.ru оно еще и работает как то любопытно.
Для одной и той же марки и модели стоимость показа данных может отличаться в 4 раза. Ради интереса протыкал несколько объявлений Infiniti QX50 I, разброс стоимости от 97 до 397 рублей.
Причем самая дорогая машина, как и самая дешевая одного года, с одинаковыми параметрами по владельцам и т.п, отличаются цветом, ценой на 20 т.р. и пробегом — у дешевой пробег меньше.
Кажется это какое то хитрое вымогательство, завязанное на популярности объявления.
maxwolf
Там, случайно, нет на эту тему аукциона? Как было у некоторых сотовых операторов (анти-АОН, анти-анти-АОН и т.д.)…
zerg59
www.drive2.ru/cars/bmw/x5/g392/?sort=selling
Вот тут номера никто не скрывает. История машин часто в блогах описана, где тоже номера есть. И это никого не парит.
musuk
drom.ru тоже не парится скрытием номеров. Потому что не пытаются монетизировать это.
Kyushu
Для автомобилей и недвижимости лучше использовать специализированные сайты, более для этого приспособленные.
musuk
drom — это самый популярный сайт продажи авто за Уралом.
unwrecker
Эту информацию надо скрывать скорее от самих досок объявлений чтоб не собирали bigdata. То есть этот сервис равно как и сервис виртуальных мобильных номеров от авито — полная чушь. Надо самому закрашивать номер до подачи объявления и покупать временную симку.
200sx_Pilot
Боюсь, в ответ на это Авито перестанет принимать по надуманному поводу объявления с закрашенными номерами.
и фиг с ними, с минусами.
в зоопарке тигру мяса недокладывают (с)
Mogwaika
У меня сегодня приняли с закрашенными, только заразы без vin не хотели принимать.
avitocare
Мы не против, если вам удобнее закрасить номер самостоятельно — пожалуйста :)
200sx_Pilot
Принципиально «не против » или «пока что не против»?
не наезд, просто уточнение.
apelsyn
Закрытый номер порождает недоверие к продавцу и существенно влияет на конверсию просмотров в звонки.
Потенциальный покупатель может подумать что вы «стремный» продавец и вам просто не позвонит.
На нашем сайте AUTO.RIA у нас тоже есть такая функция, но мы ее не рекламируем и не делаем зарисовку очень привлекательной, так как считаем это создает барьер в доверии. А саму функцию ввели чтоб люди не «уродовали» фотографию тряпочками и не лепили квадратики в paint-е.
G1lgamesh
Такой вопрос-что за данные вы отдали на разметку в толоку? Если это данные ваших пользователей, получается, по вашему пользовательскому соглашению, вы можете отдать такие достаточно чувствительные данные кому угодно для каких угодно целей?
sergeevii123 Автор
Мы отдали данные объявлений из проданных машин. Это не персональные данные, поэтому нет ограничения на их использование. Мы стараемся оградить пользователей от внимания недобросовестных личностей на этапе продажи, поэтому скрываем гос. номер.
Nova_Logic
В реальности надо читать как:
«Мы оградили жуликов от добросовестных покупателей»
gban
https://cs7.pikabu.ru/post_img/2019/04/08/6/1554714106136826171.jpg
200sx_Pilot
Не дописано «от Р.Х.»
gban
С телефона вставлял, там нельзя картинку поставить. Короче по факту сервис благодаря успешным менеджерам превратился в днище0 или днище1 днище2, днище3 деньги берут и
посылаютблокируют, разбираться не хотят, а ТС успешно решает задачу сделать его еще большим дном.ne-bo
Спасибо за статью!
А можно пожалуйтса поподробнее про дизайн тестов для инференса?
sergeevii123 Автор
Рад, что понравилось :)
Автотесты простые — есть набор картинок с известными координатами гос. знака, на них прогоняется микросервис с моделькой (также как в проде) и если где-то он ошибается, то не выкатывается.
ne-bo
И не только корги понравились)
А сколько тестовых картинок и как вы их выбирали? Глазами или как-то автоматизировали получение репрезентативного набора? Какой допуск на отклонение (в процентах наверное?)?
sergeevii123 Автор
Выбирали тяжелые кэйсы из валидации, там где модель не уверена (чуть выше порога отсеивания предсказания), чтобы следующие версии моделей не ошибались, на том что уже обрабатывается. Допуск на отклонение в координатах? также как на Толоке считается — небольшая окрестность
Xandrmoro
Госномер — важная информация при покупке авто, и скрывая его, вы помогаете мошенникам продавать «грязные» машины и дополнительно на этом зарабатываете. Молодцы, что сказать.
BDI
А толку от госномера? VIN был бы более полезен — это подробная информация о модели, дате выпуска, комплектации. При доступе к базам дилеров это ещё и история обслуживания(если не в гараже ей занимались). Да и если для вас не проблема пробить владельца по госномеру, то не вызовет затруднения связать VIN и с текущим владельцем, и со всеми предыдущими.
P.S. не уверен правда в какой зоне находятся базы по обслуживанию, и по владельцу ТС — в белой, или уже в серой? :)
Nova_Logic
они были-бы полезны в комбинации.
На авто.ру особо угарные продаваны закидывают VIN от другого авто. Зная и то и другое можно хоть проверить
Xandrmoro
Как минимум, запрет на регистрационные действия пробивается исключительно по госномеру, как и, например, висящие на этих номерах миллионы (иногда буквально) рублей штрафов. Выбирая машину за 1.5к км о таких нюансах хочется знать заранее.
Ghost_nsk
идете на сайт РСА и получаете по гос номеру номер страховки а потом по номеру страховки VIN номер.
Ghost_nsk
Ничего они не скрывают, просто дополнительно монетизируют. За цену меньше пачки сигарет они отдают все что знают и оригинальные фото. Нет тут Робин Гудов, только бизнес.
Xandrmoro
Ага, и прикрывают это заботой о нашей безопасности.
Впрочем, ничего нового.
Ghost_nsk
О том и речь, говорят о безопастности но не договаривают что за несколько монет сделают все наоборот.
ne-bo
Неужели правда всего 28 долларов за 4000 фото?
Так дёшево, не опечатка? А каждое фото размечало несколько человек?
sergeevii123 Автор
Да, правда. Три человека размечали одно фото. Толока может быть очень выгодна, если правильно её настроить.
klim76
На самом деле если вы за всё хорошее и против всего плохого, то почему бы просто не сделать пункт «скрыть ГН» при подаче объявления. Что бы сразу видно было параноиков среди продавцов.
karavan_750
Зашел прочесть статью в надежде, что наконец-то я узнаю истинные причины сокрытия гос. номера и VIN, кроме того, что неполная информация об объекте в т.ч. помогает скрыть факты мошенничества и приносит лишнюю копеечку доске объявлений.
За тех. описание решения жирный плюс, а мотивация к решению так и осталась мутной.
200sx_Pilot
Мотивация проста — возможность добавить кнопку «Показать ВИН и ГН за 100 рублей».
Одна старушка — один рубль…
Nova_Logic
Мда. Итог внедрения:
Людям сложнее понять что именно они покупают. Вместо того чтобы иметь возможность выяснить что ведро это ведро по номеру, они тратят время на то чтобы приехать к какому-то перекупу, наесться лапши и уехать. «Отличный» сервис.
interprise
чтобы брать деньги за услугу «предоставить информацию», все просто.
Cubist
А могли бы не ехать, а просто позвонить, если им так важен ГН / VIN.
Nova_Logic
а могли бы не тратить время на общение вообще, какой смысл общаться с продавцом хлама?
Amihailov
О, может вы мне сможете подсказать почему:
Заплатить, конечно, я могу, но купить машину за 450, потратить за 7 лет на ремонты и ТО ещё 350 и выставить на продажу за 300 — ну так себе я перекуп, да? :) Посему было бы круто все же, каким-то образом, присвоить тип «Продаю своё».
avitocare
Пришлите, пожалуйста, нам в личные сообщения здесь или в любой социальной сети номер обращения в службу поддержки. Проверим ещё раз, что с типом объявления.
Scooby-do
Почему такие проблемы не решает ТП, а должно решаться через публичные источники?
Maximuzz
это стандартная проблема зажиревших сайтов и корпораций — отсутствие обратной связи, ну и лютая экономия на поддержке. Просто нет такой задачи, решать проблемы пользователей.
Amihailov
Собственно и через публичные пока не решили. Из диалога:
«Автомобиль и правда уже был в продаже на Авито не так давно. Поэтому мы решили, что вы его перепродаете. Такое размещение у нас платное.»
Может быть кто-то VIN'ом моим воспользовался, чтобы историю своего ведра не палить. Тем не менее, мне на авито теперь путь заказан.
200sx_Pilot
Элементарно же.
Самостоятельно из руды, пластика, каучука и стекла собираешь автомобиль.
Продаёшь его, как «свой».
Или платишь 299 рублей Авито и получаешь возможность присвоить объявлению статус «Продаю своё» независимо от реального положения вещей.
adlerm
Это не единственный способ «вымогательства» торговых площадок…
На автору меня как-то заблокировали с пометкой «слишком низкая цена»… блин… да я рад бы продать по «вашей» средней цене… благо после обращения разблокировали… но это так, может просто сбой системы…
Но вот то что, однозначно, спланированно, так это, типа, защита номера от мошенников…
На авито не знаю, используют сейчас эту фишку или нет, но авто ру- однозначно…
в случае «защиты номера от мошенников» подменяют номер на свой,
и ок 20% звонков, перенапрявляют не на указанный в объявлении, а на соответствующие автосалоны (видимо тем кто за это приплатил)… при том робот говорит что «типа не смог дозвониться до владельца»… при том что телефон всегда доступен…
По-этому, лучше, завести отдельную сим карту для объявлений, а потом ее выкинуть.
Skerrigan
Ватермарком номер мобильного (ваш (временный)) на все до единого снимки?
Loki3000
Что-то я понял. Так перенаправляет или говорит что не смог дозвониться?
adlerm
Перенаправляет сразу, объясняя тем, что, якобы, не смог дозвониться…
для звонящего это выглядит примерно так:
-человек набирает номер который указан в объявлении.
-Робот ему говорит что-то вроде:" мы не смогли дозвониться до автора объявления, и перенаправляем Ваш звонок в...."…
-и далее идет уже звонок в какой-нибудь, соответствующий, автосалон…
в итоге, потенциальный покупатель не смог дозвониться по желаемому объявлению, и ему впарили рекламу «нужного» автосалона…
а для продавца, потеря части потенциальных покупателей…
nitro80
а зачем вы авитой пользовались, когда есть дром?
Amihailov
Диверсификация :)
200sx_Pilot
Элементарно же.
Самостоятельно из руды, пластика, каучука и стекла собираешь автомобиль.
Продаёшь его, как «свой».
Или платишь 299 рублей Авито и получаешь возможность присвоить объявлению статус «Продаю своё» независимо от реального положения вещей.
tommyangelo27
Присоединюсь к тем, кого удивляет скрытие номеров. Я живу в Польше и покупал б/у автомобиль тут. Есть государственный сайт, позволяющий по VIN, госномеру и дате первой регистрации отследить историю автомобиля — кто владелец (физическое или юр. лицо), все факты смены владельца, пройденные ТО с пробегом на дату ТО и т.д.
Так вот, если я честный владелец — я кровно заинтересован в публикации VIN, госномера и даты регистрации, для того, чтобы потенциальные покупатели убедились, что автомобиль вовремя проходил ТО, что я действительно второй владелец, что автомобиль не был использован в коммерческих целях и т.д.
И местные сайты объявлений не закрывают номер, и позволяют публиковать и номер, и VIN, и дату регистрации.
А с точки зрения покупателя, я могу фильтровать объявления, в которых указан VIN, интерфейс сайта это позволяет (бесплатно конечно).
200sx_Pilot
Ну Польша здесь как пример цивилизованного рынка.
Авито — представитель «дикого»… Эдакая «коррупция на данных».
tyomitch
Совсем не «коррупция».
Скорее, «монетизация чужих данных» — и это нынче в тренде по всему миру, Цукерберг даже в Конгрессе по этому поводу выступал.
nitro80
Бесплатно и авито. Не, не сходится
Kyushu
> пройденные ТО с пробегом на дату ТО и т.д.
уже захотелось пожить в полицейском государстве…
tommyangelo27
Техосмотр обязательный раз в год (для не новых автомобилей), данные по пробегу попадают в базу именно в момент прохода техосмотра. ТО проходится НЕ в полиции, а на любой сертифицированной станции по вашему выбору, что снижает возможности для коррупции.
Что именно вам не нравится в данной схеме? Тот факт, что пробег отмотать проблематичнее становится? Или то, что автомобиль с неисправной тормозной системой не выедет на улицу?
Kyushu
Мне, наоборот, понравилось.
Правда, я привык под ТО понимать «техническое обслуживание», а не техосмотр.
DMGarikk
внезапно в РФ тоже самое, однАко… последние лет 7 я ни разу не появлялся на станции техосмотра, хотя сам техосмотр «пройден» на самой настоящей сертифицированной станции
(а до этих 7 лет, я появлялся на станции номинально, поскольку на 20 летнем авто пройти его нереально предварительно не заехав в правильный автосервис, находящийся около гибдд… если заехать в неправильный то фары будут гарантировано не туда светить, а тормоза расходится в усилиях )
p.s. готов поспорить по поводу того что техосмотр очень нужен диагностирует ржавчину в тормозных магистралях и сорванную резьбу на болах в рулевом управлении… которые бахнут черезнеделю после вожделенного штампа об исправности ;))
onlinehead
В России очевидно нет, но я вот в Польше в прошлом году проходил.
Вот что он в себя включал:
1. Внешний осмотр авто — модификации, тонировка и т.п. Получил замечание за заклеенные желтой пленкой стоковые противотуманки, т.к. запретили пару лет назад как спец. свет. Но я его таким купил. Пропустили под честное слово оторвать пленку и предупредили что у ГАИ могут быть вопросы, если остановят.
2. Анализ выхлопа.
3. Осмотр на яме — визуальный на ржавчину и утечки, с ломиком на предмет люфтов в ходовой и т.п.
4. Стенд для измерения тормозного усилия по всем колесам и проверки АБС.
5. Вибростенд на оценку состояния подвески и амортизаторов.
6. Проверка света (работоспособность ламп, состояние\настройка фар головного света).
Общая стоимость была что-то около 110 или 150 злотых (примерно 1900-2400 рублей по курсу на сейчас).
Учитывая, что тормоза проверяли несколькими оттормаживаниями в пол, допустим, это дает некоторую уверенность, что тормозная магистраль выдержит еще год обычной эксплуатации.
DMGarikk
не дает, могу сказать по опыту двух своих предыдущих бу автомобилей
koluka
Сори, перепутал с авто.ру
apelsyn
1. 250ms хорошая скорость, на каком размере фото проводите определение 4-х точек?
2. Определяете ли вы сам номер на фото и какая точность вашего алгоритма?
sergeevii123 Автор
1. 360x360
2. Про точность не понял. Вы имеете ввиду IoU? На данных обучения или в проде?
apelsyn
Accuracy на тестовой выборке, какой процент правильно распознаных номеров?
sergeevii123 Автор
0.98
apelsyn
Отличный результат, вы молодцы! У нас скромнее 0,97 для Украинских номеров и 0,96 для номеров РФ. И еще у нас медленее, все работает на Mask RCNN, в среднем, 0.8 s/фото на GPU.
sergeevii123 Автор
Спасибо!
xakep2011
На вопрос «как» ответили интересно. На вопрос «зачем» мутно и расплывчато. Хотя, судя по комментариям, это людям тоже интересно.
solalex
Искусственный интеллект в действии
sergeevii123 Автор
Да, есть случаи, когда модель не справляется. Мы их сохраняем для дообучения модели. Спасибо, что нашли такой случай. Если вас не затруднит, дайте ссылку на объявление.
apelsyn
Наш алгоритм от AUTO.RIA, который называется Nomeroff Net успешно справляется с задачей и правильно читает номер. :)
Можете протестировать online https://nomeroff.net.ua/onlinedemo.html. Код выложен на Github.
drinkius
Ну у вас к тому же и false positive заявился. Так можно было бы и все надписи на авто начинать скрывать
apelsyn
Он класифицирован как не номер «xx-unknown», его можно не учитывать в «боевом» режиме. Другими словами мы видим похожую на номер область и понимаем что она не относится к известным нам номерам. Мы анализируем такие области, в чем здесь проблема. Такие области можно не показывать если Вам это «режет глаз»
nitro80
Вместо замазывания номеров на авто, лучше бы со спамом в сообщениях боролись
aleksandros
Лучше бы сделали номальный выбор городов. А лучше всего вернули прежний.
Gamliel_Fishkin
Прочёл с интересом.
Администратор почтового сервера, на котором пользователь Авито держит почтовый ящик, может читать письма, полученные пользователем от Авито. Кроме того, злоумышленники могут прислать пользователю фальшивое письмо, имитирующее письмо от Авито. Facebook предоставляет пользователям возможность решить аналогичные проблемы. Не собирается ли Авито предоставить такую возможность?
IvanTheCrazy
А запилите пожалуйста такую фишку — когда включаешь защиту номера телефона, блокируются звонки от коллекторских агентств. На прошлой неделе продавал машину — так коллекторы замучили, потом уже когда понял в чем дело (судя по всему подменный номер принадлежал ранее какому-то должнику) — начал их жестко троллить, но было бы круто отфильтровать их. Тем более такая возможность есть — номера, с которых поступали звонки, хорошо гуглятся как номера коллекторов, да и тот же авто.ру блокирует например звонки перекупов — значит и коллекторов забанить можно.
Gamliel_Fishkin
Подобную функциональность можно реализовать на своём смартфоне.
IvanTheCrazy
Я подобным образом и решил (только использовал приложение от Яндекса с определителем номера). Но есть как минимум 2 момента:
— что делать пользователям iOS?
— что делать пользователям звонилок куда вообще софт не установишь?
А так отфильтруется все на уровне платформы и всем хорошо.
Gamliel_Fishkin
На сайте программы есть ссылки на её сборки для семи платформ, включая Apple. С «просто звонилками» действительно грустно.
IvanTheCrazy
Ну собирать себе такую программу несколько перебор. Тем более это авито, что автоматически расширяет круг пользователей до тех, кто понятия ни о какой сборке не имеет + для сборки под iOS нужен mac и developer account ($100/год) — очень сложно получается
Gamliel_Fishkin
Чего? Там готовые сборки (а вот ссылки на исходники, увы, нет).
IvanTheCrazy
А блин, я прочитал как инструкции для сборки *бьется головой о стену*. Но все равно, в iOS о том кто звонил вы узнаете только после звонка (что особого смысла не имеет, т.к. одни и теже коллекторы мне звонили с кучи разных номеров)
Gamliel_Fishkin
Вы видели сделанные мной скриншоты?
Singaporian
Не надо банить. Можно резвиться же: кокаин в Камбодже.
teemour
Авито нечем заняться, я вижу
youtu.be/15AmJSXWEyk
Cubist
Вот же второй комментарий, который показывает как можно использовать знание гос номера.
Понятно, что можно позвонить и спросить его или приехать на осмотр, а потом сделать что-то с авто, всё можно. И замки на дверях вскрыть можно, но это не повод замки вообще не закрывать.
Кстати, номер квартиры обычно так же скрывают на сайте и узнаешь когда приходишь. Хотя все соседи знают номера квартир и тд, но на сайтах объявлений можно узнать именно о продаже объекта.
Кажется обсуждение зачем это делают лучше туда же на youtube и перенести, или на какой-то менее профильный ресурс. Там много подобных теорий зачем прячут номер.
Nova_Logic
и что? всё это не мешает провернуть тоже самое со скрытым номером.
megahertz
При обилии вариантов, злоумышленники предпочтут выбрать наименее трудозатратный.
ioffikus
Возможность скрыть реальный номер телефона, скрытые данные автомобиля (ВИН, гос. номера), Авито ресурс для честных продавцов! :) Добавьте еще перекраску авто в ваших сервисах и перебитие номеров на раме / агрегатах тогда будет точно самый лучший ресурс для продажи авто.
Kyushu
> когда вы продаёте автомобиль, для вас создается временный сотовый номер
Вот меньше всего я хотел бы заключить сделку с человеком, который использует левый сотовый номер (оформленный не на себя). Наличие номера позволяет покупателю убедиться, что представлена фотография именно продаваемого автомобиля. Кроме того, в номере указано место регистрации, что немаловажно для покупки. Очевидно, что потенциальному покупателю номер для проверки должен быть предоставлен до осмотра. Если номер частично утаивается, полная информация об автомобиле должна быть выложена в объявлении.
Например, при продаже квартир номер квартиры обычно сообщается только в момент приезда покупателя для просмотра.
Aversis
SJW на параде. Авито, вы прекрасны, но для мошенников.
Singaporian
Слушайте, я сейчас прошелся по парковке около офиса. Там сотни машин с номерами стоят. Я все аккуратно переписал на бумажку.
Все, чем они отличаются от авитовских автохозяев — тем, что не планируют продавать свои машины. То есть ничем. Даже мой список круче — в нем обведен номер машины, из которой сисястая хозяйка вышла (молодуха!).
Отдам список жертв за пол литра Жигуля. Торг неуместен.
(админ, анонимно пожалуйста — покупателя выберу по лайкам)
Barbaresk
Вы не поверите, но у меня есть полная база всех номеров автомобилей. Прилагаю кусочек из неё:
…
В995ХТ174
В996ХТ174
В997ХТ174
В998ХТ174
В999ХТ174
С000ХТ174
…
А еще есть баз пин-кодов от кредиток…
А вообще, конечно, мерзко выдавать желание нажиться за безопасность. При этом, делая еще большую дыру в безопасности.
achekalin
Скажите, когда вы уже сделаете поиск по географии (скажем, в отношении недвижимости) с привязкой к городам, а не просто к текстовому вхождению строки.
Грубо, есть часть Санкт-Петербурга город "Пушкин". А есть область вокруг него, которая называется Пушкинский район. Идем на Авито, ищем там квартиры, что видим? Правильно, точки в локациях вида «территория Славянка, посёлок Шушары, Пушкинский район, Санкт-Петербург» — а что, все верно, в этой текстовой строке есть таки подстрока «Пушкин», правильно?
Что характерно, Яндекс.Недвижимость как-то (непостижимо!) умеет искать именно там, где указано: вот тот же поиск, результаты именно про Пушкин, безо всякого Пушкинского района (причем пушкинский район можно выбрать как целевую локацию отдельно).
Я понимаю, что номера клиентских машин прятать — святое дело, но, во-первых, их прятать или нет — дело самих владельцев (а они могут в Paint замазать, если что — годами все так и делали), во-вторых, нельзя ли тему с геопоиском решить, она как-то посущественне, разве нет?
И, да, «поиск в области, видимой на карте» — это фича, но не замена описанному: при зуме на часть карты теряешь общую картину.
MINYSMOAL
Как будет вести себя система, если я выложу фото с уже замазанным номером?
sergeiss
Предположу, что возьмёт с тебя 197*N рублей, где N равно среднестатистическому количеству потенциально упущенных выплат за показ этого номера :))))))))))))))))))))))))
sergeiss
Похоже, что меня минусанили трое сотрудников Авито :)))
sergeiss
Из всего сказанного в статье и каментах я вот что не понял: а если человек совершенно сознательно хочет, чтобы номер его машины был показан на фотографии? Есть ли опция «отменить замазывание номера»?
И еще вопрос, не про автономера. Вот я ищу, допустим, дом в деревне некоего района своей области. И там находятся, в том числе, дома, относящиеся к совершенно другому району. И не один из сотни, а куда как больше. Это тоже «фича» авито или это юзеры как-то хитрО вводят данные?
avitocare
Пока такой функции нет, но всё возможно. По поиску: если какого-то населённого пункта нет у нас в списке городов, то объявления из него будут «привязаны» в поиске к ближайшему пункту той же области.
pavlushk0
Крутая статья, с удовольствием прочитал, зашёл в комменты посмотреть может кто дополнил по существу и был очень удевлён первыми же ветками комментов. Сразу наехали на Авито за эту фичу и куча людей выражают непонимание зачем скрывать номер. В моей биографии две продажи машины и оба раза самому приходилось номер закрывать на фото, не знаю зачем, просто так, ради пущей приватности наверно. И какой-то диссонанс возник — тут вррде тусуются люди из айти, с хорошими доходами и обостренным чувством, как бы это сказать, необходимости соблюдения своих прав и т.д. А комменты пишут как будто не разу не общались с авто миром и ещё и критикуют за ввод фичи, которая гарантирует эту самую приватность.
onlinehead
Так они совершенно спокойно эти данные откроют любому, кто денежку заплатит. Там есть волшебная кнопочка, которая за 1 с небольшим рублей даст отчет и прочее. Ровно как auto.ru.
stepmex
Просто здесь люди отличают приватные данные от публичных. И понимают что номера на машине ни какого отношения к приватным не имеют.
И да, статья интересная, но неодобрение вызывает предоставление платного сервиса который не нужен. Это как ходить по магазину в котором ценники показывают за отдельную плату. Неприятно(
tyomitch
Потому что заголовок статьи — «Для чего...», а в самой статье о том, для чего скрывать номера, речь не идёт.
Наехали на Авито не за фичу, а за несоответствие заголовка тексту.
MINYSMOAL
Вся эта мнимая приватность разбивается пока не узнали адрес, где стоит машина. С авито все понятно, они хотят это продавать, но почему они подают это под соусом дополнительной безопасности — не понятно. Да и в целом, каждый сам решает скрывать номер или нет, почему за меня это решение принимает авито?
ps я всегда буду обновлять комментарии :)
sergeiss
Статья крутая, согласен! Но только с чисто технической стороны. Хороший пример работы ИИ и его реализации для определенной задачи.
Вот только почему авито «бай дефолт» решает, что это должно быть так? А также речь в каментах о том, что за небольшие деньги эти данные всё равно уйдут «налево» :)))
Вот если бы они давали возможность выбора, при вводе объявы ставишь чек-пойнт «скрыть номера авто», и если ты выбрал это, то никому и никогда этот номер не будет ни показан, ни продан… То вот это да, было бы правильно. С точки зрения пользовательской.
koluka
Вы предлагаете назвать статью«Наши менеджеры решили стричь бабло со всех смотрящих вин и госномер, как это делает автору, и вот как классно мы это реализовали»?
Xandrmoro
Я очень близко общаюсь с автомиром и ни разу не понимаю, каким образом госномер — приватная информация и зачем её прятать, если ты не занимаешься махинациями.
sergeiss
И вот живой пример того, что ваш алгоритм делает дерьмецо. А именно, человек размещает фото приборной панели с одометром. Он это делает явно специально!!! Объява: www.avito.ru/kineshma/avtomobili/suzuki_ignis_2007_1087664825 (последнее фото, где спидометр/одометр показаны крупным планом).
Но вместо цифр одометра я вижу надпись «Авито». Вопрос: нафига??? Да, это не номер авто. Но какая-то часть вашего ИИ «возбудилась» на эти цифры и замазала их.
А я, как потребитель этой инфы, не получаю её.
Так что вы это, ребят… Подумайте получше!
AlexRay
Вот тоже недавно искал машины на авито и в половине случаев пробег на одометре закрыт плашкой. Я то думал это владельцы мутные какие-то, не хотят пробег показывать, так что такие объявления сразу в топку отправлял, а оказывается с владельцами то всё хорошо, это алгоритм умный слишком оказался…
200sx_Pilot
В начале пути косяки обязательно будут.
В середине пути косяки возможны.
Конец пути может сам по себе являться косяком.
Они (ИИ) ещё только учатся.