Наткнулся я на описание услуги по разметке объектов от одного известного сервиса, который капчу гадает. Не будем сыпать ссылками, чтобы не наткнуться на горы хейта. И это натолкнуло меня на мысль запилить небольшую статью. С умозаключениями в конце. А може даже и побудить многоуважаемое комьюнити на диалог (хоть бы не в лучших традициях Стака). Итак, начинаем:

С развитием информационных технологий возникает потребность в обучении моделей машинного обучения маркировке объектов, для качественного выполнения поставленных перед ними задач. К примеру:

  • обучения моделей транспортных средств с автопилотом путем маркировки объектов на изображениях дорожного движения, таких как автомобили, велосипеды и другие препятствия;

  • автоматическая маркировка одежды и вещей для обучения моделей машинного обучения визуальному поиску в электронной коммерции;

  • обучение моделей машинного обучения для определения степени повреждения определенного строения или имущества для целей страховой компани.

Для подобного рода задач используется, так называемая разметка bounding box, а если по простому - выделение конкретного объекта или рисование рамки вокруг объекта на изображении.

Давайте разбираться, что же такое bounding box? В контексте обнаружения объектов «bounding box» чаще всего представляет собой прямоугольник или параллелепипед, который служит для ограничения контуров более сложных фигур, таких как машины или силуэты людей и тп. Эти прямоугольные рамки действуют как объемлющие рамки вокруг модели. В качестве грубой приближенной модели сложных форм, такой «контейнер» используется для быстрого и удобного определения положения объекта в пространстве.

Bounding box выделяет интересующие элементы для аналитической модели, такие как люди, указатели, автомобили или любые другие объекты. Границы такой рамки задаются двумя координатами: обычно это координаты левого верхнего и правого нижнего углов. За счёт предоставления ясного метода описания положения и размеров объектов на снимке, эти базовые прямоугольные обозначения широко применяются в задачах распознавания и определения местоположения объектов.

Обнаружение объектов — наиболее популярная задача в нише компьютерного зрения. Ее цель — сделать так, чтобы алгоритмы машинного обучения могли определять наличие или отсутствие конкретных объектов на изображении, представляющих интерес.

Обнаружение объектов стало возможным благодаря методу, известному как «object detection». Модель обнаружения объектов в машинном обучении (ML) анализирует содержимое изображения, используя метки bounding box для этой цели.

2D bounding boxes для обнаружения объектов

Модели искусственного интеллекта обучаются обнаруживать объекты на изображениях с использованием методов машинного обучения, таких как глубокое обучение и нейронные сети. Для успешного обучения алгоритмов машинного обучения требуются обширные наборы данных изображений, в которых объекты четко выделены с помощью 2D bounding box рамок.

Процесс обучения начинается с подачи модели на вход множества изображений и соответствующих им bounding box, которые показывают местоположение и форму объектов на изображениях. Модель затем настраивается на этих данных, чтобы распознавать закономерности и признаки, которые помогают ей идентифицировать объекты на изображениях.

Разметка bounding box является важной частью этого процесса, так как она предоставляет модели информацию о том, где находятся объекты и какие они формы. Путем анализа множества таких изображений и их разметки, модель может научиться обобщать эту информацию и применять ее для обнаружения объектов на новых изображениях.

После обучения модель искусственного интеллекта способна автоматически идентифицировать заданные объекты на других изображениях, без необходимости человеческой интервенции. Это делает ее полезной для ряда приложений, таких как автоматическое распознавание лиц, детектирование объектов на видеозаписях, медицинская диагностика и многие другие.

И вот вопрос — какие сервисы предлагают подобные инструменты для маркировки данных.

Есть ощущение, что ниша находится на начальном этапе наполнения и пионеры смогут снять с нее определенные сливки.

Что думаете, есть будущее у этого направления?

Комментарии (1)


  1. EltoroFuerte
    20.11.2023 05:59

    Эта ниша занята уже достаточно давно как опенсорсными системами так и коммерческими. Некоторые разработчики под специфичные задачи пишут свои разметочники