Как убивали человеческий фактор в видеонаблюдении / forpes.ru

Главная
Как убивали человеческий фактор в видеонаблюдении

Как убивали человеческий фактор в видеонаблюдении +14

22.09.2016 10:30

ip-consierge 32 13000 Источник

Как «короткие данные» (Short Data) превращают огромные терабайты видеоинформации в маленькие мегабайты, будет понятно из этого видеоролика:

Извините за его длительность, разработчик научился сокращать объемы информации, но не объяснения

Вообще в теме видеонаблюдения всегда на первом негативном месте стоял человеческий фактор. Внимательность оператора была под вопросом даже с одной видеокамерой. А в сегодняшних мега-количествах маленьких видео-окошечек (при этом огромного разрешения) найти что-то тревожное составляет совсем неразрешимую задачу. Если, конечно не применять более совершенные технологии.

Для первичной обработки видеоконтента мы выбрали не мифические пересечения линий, постоянно реагирующие на всевозможные помехи и редко срабатывающие на полезные цели, а технологию «Short Data», которая не связана с распознаванием образов. О ней можем подробнее рассказать в следующий раз, если интересно. Но она, пусть и многократно, лишь отсеивает шлаки неинформативных данных, выделяя полезное зерно. А дальше снова — перед экраном человек.

К нам на видео охранное предприятие приходит видеоматериал не в виде 24 часовых огромных видеопотоков, а даже с большого числа объектов видеонаблюдения — всего один тонюсенький ручеек уже предобработанных данных. Видеособытия со всех объектов поступают в общий пул Видеоцентра и распределяются по свободным операторам, задача которых определить, есть ли в сюжете криминал, соответствует ли открывающий дверь квартиры профайлу разрешенных лиц или выполнение других условий, описанных в услуге клиента.

Для наблюдателя со стороны это крэзи-видео, потому что в этой очереди нет связки: оператор по очереди видит событие в подъезде города Махачкалы, потом на улице Караганды, затем во дворе частного дома под Хабаровском. Перед ним проходят сюжеты, между которыми нет ничего общего. Он даже не успевает порадоваться за чей-то роллс-ройс в Питере или огорчиться за выбитое окно в самарской деревне. К слову сказать, названий городов и адресов тоже нетМозг человека используется лишь для определения факта криминала в самом сюжете события.

Мозг – как винтик, никакого погружения в ауру объекта, как мы представляем себе любое кино. Без всестороннего охвата информации и всеобъемлющего анализа ситуации. Кому-то может показаться это ненадежным средством, но большинство народонаселения уже давно верит, что в видеонаблюдении и человек не нужен – компьютер сам всё может анализировать и распознавать. Мы по своей вере – центристы, верим лишь в возможности прогресса, но и не верим в то, что еще не удалось доказать. Поэтому при всей масштабной видеоаналитике последний штрих в анализе оставляем человеку.

При этом убираем всё, что присуще человеческому фактору: эмоции, невнимательность, ошибки анализа, сонливость, забывчивость, адресную составляющую… Мы превращаем его в машинный винтик общей системы, но немаловажный винтик – это природный фильтр помех. Никакой компьютер стопроцентно не отличит стаю птиц от вора, перелезающего через забор, своего родственника от незваного гостя, соседскую иномарку от иномарки хозяина. Даже, если поставить супермощный компьютер за 200 миллионов долларов, чтобы фильтровать помехи, он будет выдавать ошибки, ибо видеообработка основана лишь на контрастности. Отличить черные штаны на черном фоне и понять, что в них есть еще и тело, которого за деревом почти не видно, а светлое лицо на таком же фоне, повернутое затылком к камере, — это человек, может только один тип разума. Появление искусственного интеллекта пока запаздывает, может быть, так лет на сто. А человек решает эту задачку с одного взгляда.

Для компьютера это летящий объект размером с собаку, при этом стоящую на задних лапах

Для компьютера это один человек, а не три

Человек – это природный детектор опасности на базе инстинкта самосохранения. В отличие от самого мощного компьютера, самый низкий уровень IQ даже самой древней бабушке позволяет с максимальной точностью определить, что бандиты взламывают входную дверь, убивают человека или поджигают дом.

Естественно, человек физически не может смотреть в камеры долго, чтобы использовать свой IQ. Естественно, что каждый оператор отслеживает сразу тысячи объектов, за счет этого и достигается дешевизна услуги. Но вопрос человеческого фактора здесь не стоит, потому что сервис Айпиконсьержа соединил живых людей с технологиями видеоаналитики Short Data и собственной системой многоуровневого контроля. В этом виде видеонаблюдения вообще нет живого видео, никто ни в какие камеры не смотрит. Человек обрабатывает уже сформированные события, приходящие к нему одно за другим. Это напоминает конвейер, где рабочие закручивают гайки. Пришел видеоролик – оператор ставит резолюцию: «криминал» – «нет криминала». Если резолюция задерживается (кто-то уснул), видео-событие уходит на компьютер провизора. И потом еще выше. Таким образом невнимательность, отвлекаемость и задумчивость тоже убиваются в человеческом факторе.

Хотя, конечно, не совсем. Добить их позволяет специальное ПО оператора. Чтобы не было необдуманного машинального клика, в каждой резолюции оператор описывает характер события: пробежала белая кошка, прошел высокий сосед, пролетела птица, предположительно синица. Заметьте, в каждом определении должна указываться примета: белая, высокий, синица… Это нужно не клиенту, а самому оператору, чтобы было четкое осознание увиденного – как говорят в Апиконссьерже — включение мозгов.

И даже этим не ограничивается сервис Айпиконсьерж. Специальный программный бот-анализатор проверяет комментарии на предмет их адекватности, соответствию стилистике, грамматике, характеру деятельности, повторяемости и проч. Если за час появятся две кошки или каждый одинаковый период будет начинаться с кошки, или… — все варианты неосознанной записи тут же переправляются контролеру – провизору. Даже при большом желании расслабиться, набивать первые попавшие в голову фразы человек должен еще больше контролировать свой процесс, дабы не попасться на крючок хитрых бот-анализаторов. Всего одно нарушение – и оператор отстраняется от работы. И всегда в дежурной смене есть лишний ресурсный человек, готовый взять на себя повышение нагрузки, в том числе и за счет клиентских проблем.

Очень активно используется идентификатор лиц. Когда стоит задача определить, соответствует ли открывающий дверь человек профайлу разрешенных лиц, машина сама определяет уровень сходства, но ничего не говорит об этом оператору. Только в случае его явной ошибки, она выдает громкое предупреждение, которое отправляется и провизору. Т.е. мы не доверяем компьютерной логике при охране клиента, а лишь используем ее для контроля своего сотрудника.

Конечно, нужно добавить, что иногда приходится переключать человеческий интеллект в режим полного охвата информации. В редких случаях мы сталкиваемся со спорными ситуациями, когда видно что-то подозрительное, но конкретных фактов криминала нет. По клику на таком событии выходит вся история данного конкретного объекта за последние 24 часа, и оператор имеет возможность более детально исследовать свои сомнения.

К примеру, бывает так, что кто-то выбегает из квартиры в явно подозрительном состоянии и с большой коробкой в руках, а в истории нет даже такого события, что он в квартиру и не заходил. Тут всё просто, хозяева сэкономили на камере, поставив только одну на входной площадке, а данный тип залез через балкон. Формально мы не несем никакой ответственности, т.к. в профайле указан лишь контроль входа, но все мы люди, и счастье клиента нам дорого (чем дольше он живет – тем дольше платит). В технологии Short Data есть ряд алгоритмов, определяющих резкие отличия от постоянного образа жизни и поведения хозяев. В этих случаях история событий раскрывается автоматически. И оператор должен дать оценку причины такого раскрытия с указанием причины появления указанных зон детекции. Если он не дотронулся до них мышкой, наш софт сигнализирует о ненадлежащем исследовании проблемы. У оператора просто нет возможности недобросовестно выполнить свою работу.

Есть у нас и собственная база квартирных воришек. Да, она несовершенна, фотографии плохого качества, идентификация компьютером маловероятна, но не надо забывать, что у нас работают не только компьютеры, но и люди. При любом подозрительном событии черный список всплывает перед оператором. И, как вы уже, наверное, догадались, не просто так. Теперь перед человеком стоит задача указать на самого похожего человека в этом фотоальбоме.

В отличие от традиционного видеонаблюдения, наш оператор всю свою смену решает логические задачки, этот вариант мы называем активным видеонаблюдением.

«Короткие данные» помогают человеку в разгрузке информации, а наши технологии предназначены для убийства человеческого фактора. Возможно, мы что-то еще не учли, поэтому и ждем обратной связи от сообществ.

Поделиться с друзьями

-->

Комментарии (32)

SystemXFiles
22.09.2016 11:01
#9588910
+2
Интересно сделано все и главное правильно, вы пологаетесь на человека, как более подходящее решение (пока, думаю в будущем ситуацию может оказаться противоположной), но с помощью автоматики уменьшаете шанс ошибки.
Жаль не раскрыта техническая сторона, интересны (ИМХО) именно алгоритмы анализа поведения объектов на записи. Ведь как можно определить, что человек стал себя вести не типично?
Понимаю, что статистика тут замешана с эвристикой, но как именно идет ее обработка?
Какой порог срабатывания выбирается в определенном случае, дабы избежать ложные срабатывания?
Как система реагирует на насыщенные событиями видео? К примеру видео-камера на расепшене крупной компании. Ведь статистический анализ в таких случаях наверняка весьма сложен, ибо событий много, они разные и довольно часто не предсказуемы могут быть (из-за шума множества событий). Какие меры в данном случае применяются?
1. ip-consierge
  22.09.2016 11:38
  #9588990
  Спасибо за хорошие слова!
  
  Если Вы внимательно просмотрите вторую половину ролика, то для конкретно нашей технологии неважна оценка поведения, а важен лишь сам факт появления человека или автомобиля в зоне видимости. А также все его изменения в характере действий.
  
  Мы решаем проблему человеческого фактора, а не вопросы искусственного интеллекта. А что важнее всего для человека? — поменьше работать! Вместо загрузки в 24 часа постоянного внимания на каждой камере, мы даем только несколько минут на объект. Только и всего.
  
  А типично или не типично ведут себя люди в сюжете, решает не компьютер, а человек. Без «Short Data» он не смог бы охватить тысячи объектов одновременно.
  
  Тем более, параллельно. А с «короткими данными» он работает последовательно и в том темпе, который его устраивает.
  
  Т.е. загрузку задает не изменчивая ситуация на объекте, а сам человек — как он себя чувствует, так и работает. Никуда не торопиться, не пытается ухватить всё.

SamoilowAlex
22.09.2016 11:08
#9588924
+3
Клоунаду убрали, уровень пафоса и воды понизили — осталась только реклама.

RR_Zz
22.09.2016 11:09
#9588928
+1
>«В Москве людей нет… » https://www.youtube.com/watch?v=k6Y2nTXkUmQ
1. ip-consierge
  22.09.2016 11:12
  #9588946
  Оригинальное мнение, но мы не специалисты по теориям заговора. В ролике наших партнеров это утверждение образное. Имеется в виду, что камеры московского ДИТ-а поставлены таким образом, что толп народа там не наблюдается.
  
  И это значит, что видеоанализ можно легко проводить по технологии редких событий, а не придумывать несуществующих проблем.

Saffron
22.09.2016 11:16
#9588956
А вы не пробовали статистически определять важные события и отправлять их на просмотр более чем одному оператору для получения системы, более устойчивой к ошибкам.
1. ip-consierge
  22.09.2016 11:24
  #9588966
  Конкретно наша техника не определяет важное событие или нет, оценку делает человек. Наша техника определяет лишь сам факт наличия события. Т.е. оператор наблюдает не за живым 24-совым видео, а получает небольшое число событий, около 10 в сутки с одного объекта.
  
  Проблему человеческого фактора можно решить и без искусственных интеллектов, просто сокращением объема информации. Начало статьи об это говорит.

NINeOneone
22.09.2016 12:51
#9589152
+1
1) Если вы делаете упор на сокращение рабочего времени человека-аналитика в реальном времени, то все ок. Т.е. хорошо производить превентивные действия, на основе событий.

2) Если же делать упор на следствие (на видео говорится от имени следователя в некоторых местах), то говорить, что зря снимается и хранится все неверно. В следствии важны не только события, но и факты. Факт того, что машина или человек были в конкретном месте, или какого цвета стояли машины и прочее. Просто по изменениям этого сказать нельзя из-за ненадежности камер.

Предположим есть кадры о том, что машина приехала, потом было отключение камер, потом есть кадры что машина уехала. Вопрос, стояла ли она там все это время?
1. FDsagizi
  22.09.2016 13:38
  #9589258
  > Предположим есть кадры о том, что машина приехала, потом было отключение камер, потом есть кадры что машина уехала. Вопрос, стояла ли она там все это время?
  
  ну потерю сигнала можно так же записывать, и допустим есть кадр как машина приехала в 12,00 потом в 15,00 выключили свет, а в 16,00 включили и машины уже нет.
  
  Следовательно раз до 15,00 машина не исчезала ( нету такого кадра ) значит она там стояла
  1. ip-consierge
    22.09.2016 16:57
    #9589796
    ну потерю сигнала можно так же записывать, и допустим есть кадр как машина приехала в 12,00 потом в 15,00 выключили свет, а в 16,00 включили и машины уже нет.
    
    Да Вы спец! Совершенно верно, любые нюансы записи можно предположить по журналу отключений, а также по данным соседних камер.
    
    В следствии важны не только события, но и факты. Факт того, что машина или человек были в конкретном месте, или какого цвета стояли машины и прочее. Просто по изменениям этого сказать нельзя из-за ненадежности камер.
    
    Для следователя чаще важен тот факт, что машина там вообще появлялась.
    
    .
  1. NINeOneone
    23.09.2016 10:41
    #9591248
    >> в 16,00 включили и машины уже нет.
    
    по логике работы после включения камеры ничего не запишется в случае, если не будет изменения в изображении. Кадры что с машиной, что без нее — статичны и в запись не попадут если не будет других действий.
    
    Можно конечно предположить, что они обязательно пишут моменты после включения камер, но это уже предположение.
    
    ip-consierge
    23.09.2016 10:52
    #9591286
    по логике работы после включения камеры ничего не запишется в случае, если не будет изменения в изображении. Кадры что с машиной, что без нее — статичны и в запись не попадут если не будет других действий.
    
    Вообще любая авария и восстановление видео отражаются в видео-журнале, это тоже видеособытие, только технологическое. Показывается видеоролик того, что было за несколько секунд до отключения камеры.
    
    Это стандартная функция используемой нами программы. Собственно говоря, есть бесплатные ее версии на 4 камеры. Скачивайте и наслаждайтесь!
1. am_devcorp
  22.09.2016 14:22
  #9589356
  Если она между этими двумя событиями куда-то отъезжала, то по логике система должна была бы отловить и эти события и было бы зафиксировано два приезда и два отъезда
  
  или отключение камер имеется в виду как отключение питания?

gsaw
22.09.2016 18:00
#9589944
+3
А как отсеиваются кадры с качаюшимися деревьями?
1. ip-consierge
  23.09.2016 08:49
  #9591036
  А как отсеиваются кадры с качаюшимися деревьями?
  Никак не отсеиваются. Да и как их можно их отсеять, масками? А если люди ходят на фоне деревьев?
  
  Видеосемантика ничего не отсеивает, она лишь укорачивает. Первое качание дерева будет выведено в виде короткого видеоролика. Но дальше характер движения веток больше не будет выводится. Видеосемантика будет считать, что она показала этот тип движения и до очень длительного прекращения его не будет обращать на него внимания.
  
  Само название «короткие данные» — укорачивается всё: и полезные цели и помехи.
  1. gsaw
    23.09.2016 10:05
    #9591190
    Значит на дело надо выходить в ветренную погоду предварительно поставив деревце в кадке в кадр… Оператор даже не увидит, а через две недели все будет шито-крыто.
    
    ip-consierge
    26.09.2016 08:43
    #9595362
    Отличие видеосемантики от видеодетекции в том, что она видит движение на фоне другого движения. Поэтому особенно не увлекайтесь криминалом в плохую погоду. :)

Moskus
22.09.2016 18:49
#9590042
+1
Получилось несколько в духе Капитана Очевидность. Я не знаю, каким идиотам приходит в голову, что камера на подъезде даже многоэтажного дома видит «толпы людей» — откуда там толпы-то? Кто хоть пару раз ждал кого-нибудь у подъезда, прекрасно знает, что кроме определенных часов утром и вечером, все остальное время там никто не ходит (конечно, если подъезд не упирается в станцию метро, например). Еще более очевидно это тем, кто хоть раз самостоятельно ставил пусть самую дешевую камеру с детектором движения. Например, у меня одна камера смотрит на входную дверь, зона детекции — весь кадр, камера сама шлёт оповещения о событии на почту, плюс пишется архив через сервис Ivideon. Так я локальный архив, который ограничен 300Мб, уже несколько месяцев забить не могу.

Так что в выбрасывании кадров без какого-либо движения нет ничего необычного, инновационного и т.п., наоборот: если кто-то утверждает, что писать надо вообще всё, он, скорее всего, хочет оправдать какое-нибудь воровство и распил на покупке оборудования для гигантского ненужного архива. Есть такое изречение, что не нужно пытаться обосновать нечто чем-то еще, если это можно обосновать глупостью. Но оно перестает быть верным, когда это можно еще скорее обосновать корыстными интересами.
1. ip-consierge
  23.09.2016 09:05
  #9591072
  Так что в выбрасывании кадров без какого-либо движения нет ничего необычного, инновационного
  Да, видеодетектор изобретен несколько десятков лет назад. Но он лишь сравнивает последующую картинку с предыдущей. На улице всегда есть какой-то экшен: деревья, тени, смена освещенности, птицы, блики, дожди, снега, животные, насекомые на камерах. Видеодетекция присутствует практически всегда, ну, или в 50%. Сами посмотрите на камеры ролика.
  
  Видеосемантика сравнивает не картинки, а характеры движений — импликатуры, отделяя один вид неизвестной активности от другой, таким образом образуются СОБЫТИЯ.

rekzi
22.09.2016 19:58
#9590204
+2
Если я незаконно установлю камеру, буду с вашей помощью собирать информацию о присутствии человека в конкретном месте, то кому отвечать придется? Вы требуете согласие субъекта на сбор сведений о времени посещения объекта или обходитесь только его фотографией? Разъясните пожалуйста этот момент.
1. ip-consierge
  23.09.2016 08:56
  #9591056
  Если я незаконно установлю камеру
  Сначала поясните, какой закон запрещает устанавливать камеры?
  1. rekzi
    23.09.2016 14:12
    #9591772
    Ну например УК со статьей о неприкосновенности частной жизни. Законы об оперативно-разыскной деятельности. Законы о частной собственности. Законы о коммерческой тайне и т.п.
    И речь идет о не незаконной установке, а о незаконном сборе информации, ее хранении и обработки. Вы так подставить можете простых операторов, работающих у вас.
    
    ip-consierge
    26.09.2016 08:40
    #9595360
    Это все общие фразы, мы можем отвечать лишь по применению конкретного закона и конкретной ситуации.
    
    Если говорить не о чем, то попробуйте ответить на такой вопрос:
    То, что Вы смотрите на лицо чужого человека на улице своими глазами, нарушает его частную жизнь или нет? Тоже самое через очки как-то регламентируется? Тоже самое через окно как-то регламентируется?
    Тоже самое через камеру как-то регламентируется?
    
    rekzi
    26.09.2016 20:16
    #9597112
    Почитайте историю с Google Glass, я уверен, в случае широкого распространения в России, вас попросили бы их снять в большинстве частных объектов. В тоже время всем плевать на то, что вы запоминаете посредством зрения и слуха.
    Я спорить не хочу. Для меня понятно то, что вопрос этот вы не прорабатывали. А зря.

Vnuchok
22.09.2016 21:54
#9590504
+1
Диктор в ролике не математик. «на скорости 4-х мы можем просмотреть записи в четыре раза быстрее. То есть 24 часа мы сможем просмотреть за 8 часов»… уважаемый, 24/4=6.
1. ip-consierge
  23.09.2016 08:55
  #9591052
  Совершенно верно, не математик, не экономист и не рекламист. Настоящие разработчики обычно далеки от всех этих категорий, поэтому ляпы в непрофессиональной рекламе естественны. Ну, простите его, он больше не будет!

ip-consierge
23.09.2016 09:22
#9591118
+2
Вообще, если хотите, мы можем дать развернутую статью по технологии Short Data , и на русском языке. Но обычно такие предложения заканчиваются тем, что кто-то накидает отрицательных тыков, и наше желание отваливается само собой. Но моё дело — предложить…
1. mu3
  23.09.2016 21:26
  #9592844
  +1
  Было бы очень интересно
1. cooper0k
  23.09.2016 23:19
  #9593028
  +

DarkByte
28.09.2016 09:47
#9600688
+1
Какой же длинный ролик рассказывающий о простом детектировании движений на видео, которое назвали сложным словом, суть которого не раскрыли ли в ролике, ни в статье. Запись всего потока позволяет таким как вы использовать этот поток, и обрабатывать его по своему усмотрению, оттачивать алгоритмы, не обязательно же вечно хранить этот архив. Параллельно с этим можно писать архив движений, который будет иметь больший срок хранения и который можно отдельно просматривать, точно так же как и полную запись.
1. ip-consierge
  28.09.2016 16:16
  #9601730
  Для раскрытия сути Short Data нужно еще 4 страницы такого текста и пара роликов такой же длительности, а Вы жалуетесь на длительность этого одного ролика. Определитесь, если хотите более глубокой сути, проголосуйте — и мы дадим такую статью!
  
  Два архива — тут Вы правы, неплохо иметь и обычный, пусть и короткого срока хранения, и аналитический — длительного. Причем, есть еще и взаимосвязь — по короткому событию можно поднять полную запись из полного архива — пока он не перезаписался.
  1. DarkByte
    28.09.2016 17:08
    #9601888
    Проблема не в длине видео как таковой, ничего страшного не случится, если оно будет на 30 минут, но лишь бы там что-то происходило. А тут получилось так, что 5 минут играем в игру «найди человечка на видео меньше чем за секунду», а потом 15 минут смотрим в программу, которая просто показывает куски видео. Причём вроде достаточно пары минут чтобы понять, по какому принципу программа их показывает и в чём преимущество просмотра записей по движению от пролистывания ролика на 24 часа, но видео не заканчивается, и дальше просто «ничего не происходит».
    
    С одной стороны конечно понятно, блог корпоративный, основная его цель — пиар и продажи, но это же geektimes, а не megamozg. Читателю интересно «как оно работает» или «как сделать так же на коленке», а не «смотрите как мы умеем, возможно во второй части мы вам расскажем как оно работает».
    
    И да, раз уж вы удалили комментарий про звук к ролику на ютубе, то на всякий случай хотелось бы попросить в следующий раз использовать оба аудио канала в видео, иначе слушать в наушниках просто невозможно.