В этой публикации мы поговорим о подавляющем рынке видеоаналитики, который представлен сегодня так называемым интеллектуальным видеонаблюдением.

Уже по самой масштабности можно приклеить этому направлению понятие «классическое». Тем более что у истоков стояла фирма Intel, а это уже классика. Именно на базе ее библиотеки с открытым кодом Open CV до сих пор делают свои продукты разработчики видеонаблюдения. Гордости ради надо сказать, программисты этого направления – русские и к тому же располагались в России – в нижегородском филиале Intel. Почему располагались? Направление закрыто уже несколько лет, народ разошелся по другим фирмам. Видимо, Intel первым почувствовал бесперспективность своей «классики».

Тем не менее, дело его живет и активно развивается. Только самый ленивый разработчики систем видеонаблюдения не применил Open CV в своих «интеллектуальных» кодах. И эта библиотека после своей смерти творит чудеса! Как заявляют многие продавцы систем видеонаблюдения, вычисляет криминальные моменты, детектирует драки, определяет оставленные и унесенные предметы, находит экстремистов… И пипл хавает. Миллиарды рублей вбухиваются в такие задачи для проектов «Безопасный город», «Безопасность на метрополитене», «Операция антитеррор» и т.д. Но, это больше политика, мы же поговорим о технологиях, почему эта красивая обертка для выставок не может работать на практике.

Специалисты называют это направление «жестким», потому что алгоритмы такой видеоаналитики основаны на точном задании параметров и порядка действий: пересечь определенную виртуальную линию, превысить детектируемую площадь, поставить предмет… Существует и другое направление (не интеловское) — гибкая видеоаналитика, работа которой не привязана к формализованным задачам, но о ней мы поговорим в следующий раз.

Принцип классической «жесткой» видеоаналитики в большинстве своем основан на детекторе объектов, локализующим замкнутые области видеодетекции по общим признакам их сосуществования. Но пока нет таких принципов, чтобы четко отличать людей от собак, кошек от автомобилей, а ветку дерева от газонокосилки. К сожалению, всё это хорошо работает только в идеальных лабораторных условиях, где пытаются обходить такие скользкие моменты, как то:

1. Видеодетектор основан на контрастности. Cливающиеся с фоном области не подпадают под его анализ. А значит, невозможно хоть как-то предугадать основные параметры интересуемого объекта.

image

Первая камера видит человека на темном фоне, соответственно детектирует только белую рубашку, остальные детали тела сливаются с фоном и недоступны для анализа. Учитывая еще и проблемы освещения, отличить более темное на темном или менее темное на темном практически не представляется возможным, т.к. это находится на уровне помех.

image

Вторая видит человека на белом фоне, соответственно детектирует только темную голову и темные брюки. Белая рубашка вообще никак не учитывается, т.к. для детектора нет информации. Таким образом, первая камера вообще будет видеть несколько объектов вместо одного человека.

2. Такие явления как тень отфильтровать успешно практически невозможно – уж, больно много форм она принимает, постоянно бегая за всеми нами.

image

В результате пропорции цели нарушены, и компьютер не понимает, что это человек.

3. Пересекающиеся цели приводят разум «железяки» в полных хаос. Определить, что это два человека, а не один или не пять, сегодняшние алгоритмы точно не могут.

image

4. Групповые цели неотличимы по форме детекции от сторонних объектов, например, несколько человек и автомобиль.

image

5. Параметр «размер объекта», на который уповают демонстраторы видеоаналитики при доказательстве возможности отличать людей от машин, неприемлем в 2D-видеонаблюдении в принципе.

image

Что больше: птица или автомобиль?

6. Часто приходится слышать такое достижение: но мы же регистрируем сразу несколькими камерами! Это, пожалуй, должно звучать как недостаток, ибо камеры видят объект по-разному.

image

— Первая видит темный гладкий затылок, вторая — светлое лицо с длинным выступом — носом.
— Первая видит большой объект, т.к. человек идет к ней ближе, вторая маленький, т.к. человек дальше. Перспективы у двухмерного зрения нет.
— Первая видит надпись на передней стороне майке «Спорт», вторая — на задней «Отдых».
— Первая видит качающуюся ветку над головой человека, по перспективе сливающуюся с головой. Вторая – муху, севшую перед камерой, создающую вид слона (ведь она ближе).
Вообще, перечень того, почему жесткая видеоаналитика невозможна в на практике, длинный, но у него есть очень интересный аспект: Данные проблемы легко скрыть при заранее подготовленном показе.

Заданный однородный фон, заданный контрастный костюм, заданные действия с непересекающимися целями, отсутствие помех в виде кустов, деревьев, осадков, бликов… Всё это у себя в офисе легко организовать, и тогда видеоаналитика превращается в чудо!

P.S.: Только это мы говорили про «классику», которую давно похоронил создатель, и имя которой эксплуатируется во многих денежных проектах. Но есть на рынке и живые алгоритмы видеоаналитики, об их достоинствах и недостатках поговорим в следующей статье.

Вполне возможно, что и труп когда-нибудь воскреснет. Ну, на каком-нибудь этапе новых типов компьютеров или систем ренгено-видеонаблюдения. Хотелось бы уже потому, что Интел, скорее всего, был не первым, в его нижегородскую лабораторию «Computer Vision» пришли русские ребята из других российских фирм, которые и стояли у истоков видеоаналитики. По сути, это российское изобретение. И жаль, что приходится писать такие статьи. Но ради этого не обманывать же другой российский народ, который все еще покупает несвежее, рекламой обработанное мясо?

Комментарии (15)


  1. Monnoroch
    08.05.2015 15:26
    +6

    Определить, что это два человека, а не один или не пять, сегодняшние алгоритмы точно не могут.

    Даже автор не смог определить, что это три человека.


    1. datacompboy
      08.05.2015 15:28

      Именно поэтому я просматривал все движения максимально отфильтровывая движение в нерелевантных областях…


    1. Videoanalitic Автор
      08.05.2015 16:11

      Старый анекдот: «Кто дойдет до этой страницы, получит 5 в зачет», — такую надпись реально делал наш препод в середине его книги, по которой сдавались экзамены.

      Вы, Monnoroch, показали, что здесь есть люди, читающие статьи с особой внимательностью. Грейт!

      Вы сразу же нашли закладку!


    1. Borz
      08.05.2015 16:19

      del


  1. avorsa
    08.05.2015 16:37

    Вполне возможно, что и труп когда-нибудь воскреснет. Ну, на каком-нибудь этапе новых типов компьютеров или систем ренгено-видеонаблюдения. Хотелось бы уже потому, что Интел, скорее всего, был не первым, в его нижегородскую лабораторию «Computer Vision» пришли русские ребята из других российских фирм, которые и стояли у истоков видеоаналитики. По сути, это российское изобретение. И жаль, что приходится писать такие статьи. Но ради этого не обманывать же другой российский народ, который все еще покупает несвежее, рекламой обработанное мясо?

    вы взорвали мой мозг…


    1. Videoanalitic Автор
      08.05.2015 16:41

      Спасибо!


    1. Borz
      08.05.2015 16:46

      а ещё так:

      Вполне возможно, что и труп когда-нибудь воскреснет. Ну, на каком-нибудь этапе новых типов компьютеров или систем ренгено-видеонаблюдения. Хотелось бы уже потому, что Интел, скорее всего, был не первым, в его нижегородскую лабораторию «Computer Vision» пришли русские ребята из других российских фирм, которые и стояли у истоков видеоаналитики. По сути, это российское изобретение. И жаль, что приходится писать такие статьи. Но ради этого не обманывать же другой российский народ, который все еще покупает несвежее, рекламой обработанное мясо?


  1. Archie_RU
    08.05.2015 16:58

    Когда только начинали разрабатывать такую систему помню ей порвало системе аналитики шаблон, когда мы следили за футболистами и вдруг один решил завязать шнурки. Система вдруг внезапно потеряла человека и обнаружила шевелящуюся коробку на поле.


  1. erlyvideo
    08.05.2015 18:56
    +1

    Грубо, но достаточно честно.


  1. pyrk2142
    08.05.2015 19:50

    На мой взгляд, главная проблема современного подхода к видеоаналитике в том, что очень часто невозможно выделить все ситуации, которые могут произойти в зоне наблюдения, и корректно их обработать. Просто потому, что их почти невозможно предсказать на стадии проектирования. А без выделения всех ситуаций или появления искусственного интеллекта нельзя получить комплексное работающее решение.


  1. kodart
    08.05.2015 19:53

    1. Стереокамера должна дать инфу о расстоянии до объекта (+ размер)
    2. Тепловая камера должна отделить объекты от фона (значение температуры отделит человека от других теплых объектов)

    Всегда есть способ улучшить систему


    1. datacompboy
      09.05.2015 12:10
      +2

      Особенно хорошотеплокамера работает в случае зимней одежды и на фоне автомобилей.


  1. Calvrack
    08.05.2015 20:37

    Я никак не пойму, зачем ставить нереальные требования к системе видео-аналитики. Она должна быть лучше охранника по каким-то KPI и стоить дешевле. Вот как бы и все. Глубокий анализ видео тоже вот-вот станет возможен, но сумасшедшими ресурсами. И так будет еще лет 10, до больших прорывов в производительности.
    А так да — простые подходы выглядят наивными, но дают лучшее отношение точность/качество.


    1. datacompboy
      09.05.2015 12:11

      Нет. Она должна позволять экономить число охранников.


  1. psazhin
    09.05.2015 15:15
    +3

    Но есть на рынке и живые алгоритмы видеоаналитики, об их достоинствах и недостатках поговорим в следующей статье.

    Есть подозрение, что в следующей статье некто Олег Гришанин будет рекламировать статистическую аналитику от спецлаб, которые нынче гоал.ру. Только назовет её в маркетинговых целях словом семантическая.
    И про суточный архив за 3 секунды мы тоже услышим.

    Похоже, эта публикация — реакция на новых для них конкурентов по коттеджной аналитике, компанию Синезис, они 5 мая объявили о выходе на этот рынок: habrahabr.ru/company/synesis/blog/257219