Знаете ли вы, что в ассортименте вендоров ПО для видеосистем есть много решений для прикладных задач торговли — модулей для подсчета посетителей, определения длины очереди, контроля операций на кассе и т.п. А предложений для решения производственных и промышленных задач практически нет. Все потому что мы, разработчики ПО для видеонаблюдения, для производства, в отличие от ритейла, разрабатываем редко, и стоит это дорого.
Почему? Давайте разбираться.
Изначально системы видеонаблюдения были изобретены для безопасности. Они решали традиционные задачи: хранение архива, отображение на экраны операторов, детектирование движения и поиск в архиве. Вне зависимости от того, к какой отрасли относится объект, на котором установлена видеосистема, подход к решению этих задач одинаков. И технологии их решения, разработанные однажды, успешно применяются на миллионах разных объектов.
Со временем системы видеонаблюдения пошли дальше и научились решать несколько более сложные задачи – анализировать видео: распознавать лица, распознавать автомобильные номера, искать по разнообразным параметрам. И вновь на каком бы объекте это не делалось, процесс происходит примерно одинаково, ведь, например, для модуля распознавания номеров нет разницы, находится автомобиль у ворот торгового центра или завода.
Следующий шаг – решение более узких специализированных задач, выходящих за рамки обеспечения безопасности. В первую очередь такие системы появились для ритейла. Они могут анализировать перемещение покупателей, определять длину очереди, считать посетителей, выявлять наиболее активные зоны торгового зала. И все это работает достаточно эффективно.
Тепловая карта интенсивности движения Macroscop в холле торгового центра
Теперь логично сделать следующий шаг: если мы научили системы анализировать видео и решать прикладные задачи на одних объектах, почему бы не вводить это повсеместно? Не только в торговлю, но и, например, на производство, и тогда системы смогут заменить рабочих, которые занимаются низкоквалифицированным трудом.
На практике все не так просто. Если базовые задачи по обеспечению безопасности однотипны, задачи по видеоанализу для ритейла тоже однотипны (потому что не так важно, что продавать, магазины в целом продают одинаково, независимо от того, что стоит на полках), то у производства задачи самые разнообразные. Все производство разное и для каждого существует свой производственный процесс.
Судите сами. В Macroscop мы получаем много запросов на видеоаналитику от разных производственных компаний. Например, с помощью видеосистем наши заказчики хотят:
• распознавать отломившийся зубец экскаватора;
• определять фракции щебня в кузове самосвалов на карьере;
• считать пластиковые бутылки в паллете;
• детектировать драгоценные камни на конвейерной ленте.
Даже эти задачи настолько разные и специфичные, что для каждой из них, необходимо заниматься индивидуальной разработкой. Стандартными инструментами, разработанными однажды, их не решить. А такая индивидуальная разработка стоит дорого.
Логично, что широко тиражируемый продукт стоит дешевле, чем продукт, который производится меньшими объемами. Для того, чтобы разработать технологию и наладить производство, необходимо сделать определенные инвестиции, которые должны окупиться за счет продаж. И чем большее количество экземпляров разработанного продукта продается, тем меньшая сумма затрат на производство вкладывается в стоимость каждой единицы. Когда ваша задача совсем индивидуальна, продукт для ее решения производится в единственном экземпляре (и вероятность того, что еще кто-то когда-то это купит, мала), все инвестиции разработчиков точно также включаются в его стоимость. Пропорция проста: меньший спрос — бОльшая цена.
Есть в практике Macroscop и примеры самостоятельного решения нестандартных производственных задач с минимальными затратами, когда заказчики просто проявили смекалку и воспользовались стандартными инструментами видеоанализа.
Например, одна из компаний, которая занимается производством кровельных материалов решает силами видеосистемы задачу обнаружения дефектов (дырок) в производимом материале с помощью детектора движения. Вот что представляет из себя их система:
Материал движется по конвейерной ленте через темный короб. В нижней части короба установлен источник света, направленный вертикально вверх (сквозь ленту), видеокамера расположена сверху, напротив источника, и направлена вертикально вниз. В случае, если на отрезке материала отсутствуют отверстия, картинка на камере абсолютно черная, но, если на участке материала в темном коробе есть дефект, камера фиксирует просветы (пятна света). В Macroscop настроена реакция на появление этих световых пятен (используется детектор движения), и по событию запускается внешнее приложение, которое информирует оператора о наличии дефекта.
Стоимость программной составляющей этого решения 1800 рублей (за 1 камеру).
Не все разделяют нашу точку зрения. У одних наших коллег по цеху есть мнение, что в общем и целом все задачи, какими бы разными они не были, можно классифицировать и подвести под какие-то универсальные разработки.
Но эффективно классифицировать можно только тогда, когда в одинаковых классах окажутся действительно очень близкие задачи, для решения которых можно применять одни и те же подходы. Если в одном классе оказалось 5 вроде бы схожих задач, но для их решения все-равно нет универсального алгоритма, эта классификация становится бессмысленной. К какому классу, например, отнести задачу обнаружения отломившегося зубца экскаватора?
С другой стороны, совершенно очевидно, что будущее именно за этим. Ведь можно классифицировать задачи, например, на распознавание каких-то объектов или какого-то события. И, вероятно, очень скоро в видеосистемах появятся алгоритмы, которые смогут распознать все, что угодно. В определенной степени такие разработки применимы уже сейчас.
Не так давно мы познакомились с компанией blippar, которая, как она сама говорит, сделала первый в мире визуальный браузер. Они сделали приложение для мобильных устройств, которое распознает любые предметы, которые попали в объектив камеры мобильного телефона, и выдает контент о них. Уже сегодня это вполне рабочее приложение, которое показывает достаточно неплохие результаты.
Все это говорит о том, что уже сейчас создаются перспективные технологии видеоанализа, которые, являются универсальными, работают в разных условиях и не требуют доработки под конкретные задачи.
Вполне очевидно, что в будущем задача распознавания станет фундаментальной, базовой функцией, которую можно будет применять повсеместно, в том числе на производственных объектах для решения специальных задач.
Но нужно разделять настоящее и будущее. И сегодня, пока технологии не находятся на таком уровне, у заказчиков с узкой специфичной производственной задачей есть три варианта:
1. Платить достаточно большие деньги за индивидуальную разработку.
2. Проявлять смекалку и находчивость, применяя стандартные инструменты нестандартными способами.
3. Или не использовать видеоанализ, а подключать человеческие ресурсы.
Почему? Давайте разбираться.
Изначально системы видеонаблюдения были изобретены для безопасности. Они решали традиционные задачи: хранение архива, отображение на экраны операторов, детектирование движения и поиск в архиве. Вне зависимости от того, к какой отрасли относится объект, на котором установлена видеосистема, подход к решению этих задач одинаков. И технологии их решения, разработанные однажды, успешно применяются на миллионах разных объектов.
Со временем системы видеонаблюдения пошли дальше и научились решать несколько более сложные задачи – анализировать видео: распознавать лица, распознавать автомобильные номера, искать по разнообразным параметрам. И вновь на каком бы объекте это не делалось, процесс происходит примерно одинаково, ведь, например, для модуля распознавания номеров нет разницы, находится автомобиль у ворот торгового центра или завода.
Следующий шаг – решение более узких специализированных задач, выходящих за рамки обеспечения безопасности. В первую очередь такие системы появились для ритейла. Они могут анализировать перемещение покупателей, определять длину очереди, считать посетителей, выявлять наиболее активные зоны торгового зала. И все это работает достаточно эффективно.
Тепловая карта интенсивности движения Macroscop в холле торгового центра
Теперь логично сделать следующий шаг: если мы научили системы анализировать видео и решать прикладные задачи на одних объектах, почему бы не вводить это повсеместно? Не только в торговлю, но и, например, на производство, и тогда системы смогут заменить рабочих, которые занимаются низкоквалифицированным трудом.
Не тут-то было…
На практике все не так просто. Если базовые задачи по обеспечению безопасности однотипны, задачи по видеоанализу для ритейла тоже однотипны (потому что не так важно, что продавать, магазины в целом продают одинаково, независимо от того, что стоит на полках), то у производства задачи самые разнообразные. Все производство разное и для каждого существует свой производственный процесс.
Судите сами. В Macroscop мы получаем много запросов на видеоаналитику от разных производственных компаний. Например, с помощью видеосистем наши заказчики хотят:
• распознавать отломившийся зубец экскаватора;
• определять фракции щебня в кузове самосвалов на карьере;
• считать пластиковые бутылки в паллете;
• детектировать драгоценные камни на конвейерной ленте.
Даже эти задачи настолько разные и специфичные, что для каждой из них, необходимо заниматься индивидуальной разработкой. Стандартными инструментами, разработанными однажды, их не решить. А такая индивидуальная разработка стоит дорого.
Логично, что широко тиражируемый продукт стоит дешевле, чем продукт, который производится меньшими объемами. Для того, чтобы разработать технологию и наладить производство, необходимо сделать определенные инвестиции, которые должны окупиться за счет продаж. И чем большее количество экземпляров разработанного продукта продается, тем меньшая сумма затрат на производство вкладывается в стоимость каждой единицы. Когда ваша задача совсем индивидуальна, продукт для ее решения производится в единственном экземпляре (и вероятность того, что еще кто-то когда-то это купит, мала), все инвестиции разработчиков точно также включаются в его стоимость. Пропорция проста: меньший спрос — бОльшая цена.
Можно сэкономить
Есть в практике Macroscop и примеры самостоятельного решения нестандартных производственных задач с минимальными затратами, когда заказчики просто проявили смекалку и воспользовались стандартными инструментами видеоанализа.
Лайфхак
Например, одна из компаний, которая занимается производством кровельных материалов решает силами видеосистемы задачу обнаружения дефектов (дырок) в производимом материале с помощью детектора движения. Вот что представляет из себя их система:
Материал движется по конвейерной ленте через темный короб. В нижней части короба установлен источник света, направленный вертикально вверх (сквозь ленту), видеокамера расположена сверху, напротив источника, и направлена вертикально вниз. В случае, если на отрезке материала отсутствуют отверстия, картинка на камере абсолютно черная, но, если на участке материала в темном коробе есть дефект, камера фиксирует просветы (пятна света). В Macroscop настроена реакция на появление этих световых пятен (используется детектор движения), и по событию запускается внешнее приложение, которое информирует оператора о наличии дефекта.
Стоимость программной составляющей этого решения 1800 рублей (за 1 камеру).
Альтернативная точка зрения
Не все разделяют нашу точку зрения. У одних наших коллег по цеху есть мнение, что в общем и целом все задачи, какими бы разными они не были, можно классифицировать и подвести под какие-то универсальные разработки.
Но эффективно классифицировать можно только тогда, когда в одинаковых классах окажутся действительно очень близкие задачи, для решения которых можно применять одни и те же подходы. Если в одном классе оказалось 5 вроде бы схожих задач, но для их решения все-равно нет универсального алгоритма, эта классификация становится бессмысленной. К какому классу, например, отнести задачу обнаружения отломившегося зубца экскаватора?
С другой стороны, совершенно очевидно, что будущее именно за этим. Ведь можно классифицировать задачи, например, на распознавание каких-то объектов или какого-то события. И, вероятно, очень скоро в видеосистемах появятся алгоритмы, которые смогут распознать все, что угодно. В определенной степени такие разработки применимы уже сейчас.
Не так давно мы познакомились с компанией blippar, которая, как она сама говорит, сделала первый в мире визуальный браузер. Они сделали приложение для мобильных устройств, которое распознает любые предметы, которые попали в объектив камеры мобильного телефона, и выдает контент о них. Уже сегодня это вполне рабочее приложение, которое показывает достаточно неплохие результаты.
В итоге
Все это говорит о том, что уже сейчас создаются перспективные технологии видеоанализа, которые, являются универсальными, работают в разных условиях и не требуют доработки под конкретные задачи.
Вполне очевидно, что в будущем задача распознавания станет фундаментальной, базовой функцией, которую можно будет применять повсеместно, в том числе на производственных объектах для решения специальных задач.
Но нужно разделять настоящее и будущее. И сегодня, пока технологии не находятся на таком уровне, у заказчиков с узкой специфичной производственной задачей есть три варианта:
1. Платить достаточно большие деньги за индивидуальную разработку.
2. Проявлять смекалку и находчивость, применяя стандартные инструменты нестандартными способами.
3. Или не использовать видеоанализ, а подключать человеческие ресурсы.
Поделиться с друзьями
Комментарии (3)
POS_troi
30.06.2016 18:36+4как-то странно смотрится «лайфхак» на конвеере, эта задача решается намного проще и дешевле использованием фотодатчика. Скорость реакции выше, можно увеличить скорость конвейера и нарастить количество продукции в час (если конечно технология производства позволяет), но даже без увеличения скорости конвейера фотодатчик будет в сотню раз дешевле а то и гораздо больше чем в сотню.
darkAlert
Я думаю разница между производством и ритейлом в требуемом уровне точности.
К примеру, определить размер очереди, или подсчитать число посетителей не критичные задачи, допускающие небольшие ошибки.
Но пропустить на конвейере бракованный товар — серьезная ошибка.
А как не крути, но даже сейчас большинство алгоритмов не достигли 99.999999% точности. Даже распознавание лиц это до сих пор не решенная до конца задача, хотя решают ее уже третье десятилетие.
romy4
Распознавание лиц, которые находятся на материале, что движется через короб.