Разметка данных играет ключевую роль в развитии совершенно разных технологий: от автопилотов и голосовых помощников до агро- и тяжелой промышленности. Но процесс разметки может быть трудоёмким и занимать много времени. Чтобы упростить эту задачу, важно выбрать инструменты, которые подходят для вашей задачи и могут сделать работу быстрее и удобнее.
В этом руководстве мы разберем самые популярные решения для разметки данных и разберём, какой стоит выбрать именно вам.
CVAT
CVAT (Computer Vision Annotation Tool) стал одним из наиболее востребованных инструментов для аннотации изображений благодаря своему функционалу и удобству использования. Кстати, не все знают, что инструмент создали ребята из Нижнего Новгорода. Мы в Data Light часто его используем для совершенно разных проектов. Вот список главных преимуществ и недостатков инструмента:
Преимущества CVAT
Удобная веб-версия: CVAT предлагает пользователям возможность работать через веб-интерфейс, что избавляет от необходимости устанавливать программу на компьютер.
Кастомизация: CVAT, как open-source решение, предоставляет пользователям полную свободу в настройке платформы под свои нужды. Это делает инструмент гибким и адаптируемым, позволяя интегрировать его в различные рабочие процессы. В документации CVAT можно найти подробные инструкции по кастомизации, что делает процесс настройки более доступным даже для новичков.
Многофункциональность: CVAT поддерживает различные виды аннотаций, включая bounding boxes, полигоны, ключевые точки и другие. Это делает его универсальным инструментом для различных проектов.
-
Командная работа: Одной из сильных сторон CVAT является возможность организации совместной работы. Инструмент позволяет нескольким пользователям одновременно работать над одним проектом, распределяя задачи между участниками команды.
И еще одна особенность: менеджеры проектов имеют полный доступ ко всем задачам, а исполнители видят только те, которые им назначены. Это позволяет эффективно управлять рабочими процессами и повышает продуктивность команды.
Выгодная ценовая политика: CVAT предлагает конкурентоспособные условия использования, что делает его привлекательным вариантом по сравнению с другими инструментами.
Активное сообщество: Как и многие open-source проекты, CVAT имеет активное сообщество пользователей и разработчиков. Это сообщество постоянно работает над улучшением платформы, делится идеями, решает возникающие проблемы и предлагает новые функции.
Подробная документация: Документация CVAT включает в себя подробные описания функционала, примеры использования, лайфхаки и изображения. Регулярные обновления документации гарантируют, что пользователи всегда будут в курсе последних изменений и улучшений.
Недостатки CVAT
Высокие требования к ресурсам: Одним из основных недостатков CVAT являются его высокие требования к серверным ресурсам, это может стать проблемой для некоторых команд. Например, в одном из наших проектов, где требовалась разметка изображений с большим количеством мелких пузырей руды, CVAT просто не прогружал данные. Мы были вынуждены разделить каждое изображение на четыре части, аннотировать их по отдельности и затем снова объединить.
Сложная установка и настройка: Хотя у CVAT есть широкие возможности для кастомизации, процесс его установки и настройки может быть довольно сложным, особенно для тех, кто не имеет опыта работы с подобными инструментами, а в некоторых из других приложений из списка можно просто зарегистрироваться и сразу начать работу.
LabelMe
LabelMe - это веб-инструмент с открытым исходным кодом, разработанный на Python, и используется он в основном для разметки изображений. Этот инструмент предоставляет разнообразные возможности для создания различных типов разметок и экспорта данных в различные форматы.
Преимущества:
Гибкость: LabelMe позволяет создавать и адаптировать разметки под конкретные задачи проекта, что делает его универсальным инструментом.
Простой интерфейс: Интуитивно понятный интерфейс облегчает использование инструмента даже для тех, кто не обладает глубокими техническими навыками.
Стабильный и простой в использовании: Доступ к инструменту можно получить из любого места, и он позволяет аннотировать изображения, не устанавливая программу и не копируя большие датасеты на свои компьютеры.
Возможность кастомизации: Пользователи могут создавать кастомные функции с использованием HTML и JavaScript. И отдельный плюс: инструмент позволяет извлекать сегментационные маски.
Недостатки:
Ограниченные форматы: Данные можно сохранять только в формате JSON, для работы с другими форматами требуется использование сторонних скриптов.
Не поддерживает координацию работы в команде: LabelMe не предоставляет удобных инструментов для совместной работы. Он также не позволяет мониторинг производительности разметки и проверку качества в реальном времени.
Ограниченные возможности для работы с большими наборами данных: Инструмент не поддерживает резервное копирование и управление большими датасетами, что делает его менее подходящим для масштабных проектов. А еще требуется вручную распределять и собирать статистику, что увеличивает операционные расходы.
LabelImg
LabelImg — это один из наиболее простых и удобных инструментов для быстрой разметки изображений. Он поддерживает множество форматов аннотации данных и легко устанавливается на операционные системы Windows.
Преимущества:
Простота использования: LabelImg идеально подходит для быстрого создания разметки на небольших наборах данных благодаря своей легкости в освоении.
-
Удобное приложение, совместимое с разными системами: LabelImg написан на Python и использует Qt для своего графического интерфейса. Это делает его отличным выбором для систем на базе Linux, которые не поддерживаются многими программами для разметки.
Кроме того, для Windows LabelImg предлагает автономное приложение, не требующее установки и имеющее размер чуть более 13 МБ.
Недостатки:
Ограниченные функции: LabelImg ограничен только разметкой объектов в виде прямоугольных рамок (bounding boxes), это сужает его применение до задач по обнаружению и распознаванию объектов и лиц. Кроме того, экспорт разметки в LabelImg не поддерживает популярные форматы, такие как COCO и OpenImages.
Не поддерживает дополнение данных изображениями: это ограничивает использование инструмента для создания датасетов. Дополнение данных часто приходится делать уже во время обучения с использованием библиотек глубокого обучения.
Supervisely
Supervisely — это платформа, предназначенная для полного сопровождения проектов в области компьютерного зрения. Она охватывает весь цикл разработки и исследований, от разметки данных до обучения моделей.
Преимущества:
Удобный интерфейс: Пользователи ценят Supervisely за его интуитивно понятный и кастомизируемый интерфейс, который упрощает работу с платформой.
Развитая экосистема приложений: В Supervisely Apps уже представлено множество готовых виджетов, которые позволяют расширить функционал любой части платформы. Каждый из них имеет открытый исходный код и доступен на GitHub, что дает возможность не только изменять существующие приложения, но и создавать новые.
Гибкое ценообразование: Стоимость использования зависит от выбранных модулей и количества пользователей, а не от объёма аннотаций, что позволяет контролировать затраты.
Эффективность при работе с большими изображениями: В отличие от CVAT, Supervisely обеспечивает качественную разметку изображений большого размера без необходимости их сжатия.
Недостатки:
Высокая стоимость: Несмотря на обширные возможности, Supervisely может оказаться менее выгодным выбором в финансовом плане по сравнению с другими инструментами.
Label Studio
Label Studio — это многофункциональный инструмент, который используется для разметки данных в задачах компьютерного зрения. Благодаря модульной архитектуре, его функционал легко расширяется и адаптируется под специфические нужды проекта.
Преимущества:
Простота и удобство: Интерфейс Label Studio интуитивен и позволяет быстро приступить к работе. Все основные действия можно выполнять в одном окне, что экономит время.
Расширяемость: Модульная структура позволяет легко добавлять новые функции и интегрировать дополнительные типы разметок.
Гибкость: Пользователи могут самостоятельно создавать разметку с помощью кода, что открывает новые возможности для кастомизации.
Недостатки:
Высокие требования к ресурсам: Для полноценного использования Label Studio может потребоваться значительное количество ресурсов, что делает его менее удобным для пользователей с ограниченными возможностями.
Ограничения в разметке Bounding Boxes: В то время как, к примеру, CVAT предлагает более удобный и быстрый инструмент для разметки Bounding Boxes, Label Studio лучше подходит для разметки аудиоданных.
Выбор инструмента для разметки зависит от специфики проекта, объёмов данных и требований к функционалу. Если ваша цель — гибкость и простота использования, то LabelMe и LabelImg могут стать отличными выборами для небольших проектов. А вот Supervisely и Label Studio предлагают более широкие возможности и подходят для работы с большими данными и сложными задачами.
А если вам интересно узнать больше о разметке в CVAT, как Data Light использует инструмент на проектах и какие лайфхаки мы нашли, читайте эту статью.
krisnaumova
Я всегда думала, что разметка данных - это просто, но оказывается, это целое искусство) Особенно впечатляет функционал CVAT и его возможность кастомизации. Здорово, что у нас есть такие мощные инструменты, которые упрощают эту задачу.