Всем привет! В предыдущей статье я уже рассказывал о том, какие 8 внешних факторов могут влиять на скорость и точность работы систем распознавания лиц на видеопотоках. Сегодня речь пойдет о не менее важных внутренних аспектах — архитектуре системы и правильном выборе и настройке оборудования.

Вначале немного о том, как проводились испытания:

В 2023 году в процессе подготовки к двум проектам класса «‎Безопасный город» мы решили провести ряд специализированных испытаний в различных условиях уличной эксплуатации, чтобы выявить прямые и косвенные факторы, влияющие на результативность проектируемых систем.

В исследовании участвовало несколько компаний партнеров: ООО Тридиви, АО Папилон, ООО Квирит, В общей сложности из ~5 500 лиц прохожих было произведено 1 056 попыток идентификации участников по тестовой базе в 528 000 лиц.    ООО Аркона, ООО Национальные технологии (ГК Ростех).
В исследовании участвовало несколько компаний партнеров: ООО Тридиви, АО Папилон, ООО Квирит, ООО Аркона, ООО Национальные технологии (ГК Ростех).
  • Испытания проводились с ноября 2023 по июль 2024 года в трех городах — Санкт-Петербурге, Москве и Челябинске, что позволило учесть различные климатические условия и сезонные изменения.

  • Использовались камеры с разными параметрами разрешения и углами обзора, а также проверялась высота установки (2-4 м) и места монтажа (например, опоры светофоров и общественного транспорта).

  • В общей сложности из ~5 500 лиц прохожих было произведено 1 056 попыток идентификации участников по базе в 528 000 лиц.

Подробнее об условиях испытаний вы можете прочесть в первой части статьи "8 внешних факторов, влияющих на эффективность распознавания лиц с видеокамер"

А теперь к результатам:

Внутренние факторы:

1. Пропускная способность сети

Степень влияниянизкая (4 потери на 1056 попытках).

Существующая городская инфраструктура может оказаться не готова к «прокачиванию»‎ основных (лучших по качеству и разрешению) потоков видео с большого количества камер до ЦОД. В итоге мы получаем пропуски кадров и кратковременные зависания видео. Были случаи, когда мы теряли не единичные кадры, а целые проходы людей.

2. Стабильность работы оборудования

Степень влияниязначимая (11 потерь на 1056 попытках).

При передаче потока с камеры до серверов видеоаналитики данные проходят через ряд устройств: саму камеру, POE-коммутатор, свитчи на пути в ЦОД, сервер видеозаписи, сервер видеоаналитики, сервер хранения векторов лиц и сбора результатов идентификации. Все это железо может дать сбой именно в тот момент, когда нужный нам человек окажется в поле зрения камеры и будет смотреть в ее сторону.

Пример изображения с камеры во время сбоев оборудования
Пример изображения с камеры во время сбоев оборудования

3. Разрешение изображения с камеры

Степень влияниязначимая (22 потери на 1056 попытках).

Чем выше разрешение камеры, тем выше соблазн использовать ее для охвата наибольшей территории. Это приводит к тому, что относительный размер лиц становится меньше, добавляются искажения при приближении к краям кадра, а общее качество лиц «проседает». При увеличении разрешения начинает увеличиваться стоимость камеры, а еще добавляются затраты на инфраструктуру доставки потока в ЦОД и дисковое хранилище.

Изображения с 2K и FullHD камер
Изображения с 2K и FullHD камер
Изображения с 2K и FullHD камер
Изображения с 2K и FullHD камер

4. Качество матрицы камеры

Степень влияниявысокая (27 потерь на 1056 попытках).

Пока человек движется в поле зрения камеры, система отслеживает его лицо и ищет наилучшее изображение по углам наклона/поворота, размытости, расстоянию между глазами, освещенности и т.д. Анализу подвергаются от 15 до 30 кадров в секунду на протяжении нескольких секунд.

Чем крупнее физический размер матрицы и чем меньше разрешение изображения в пикселях (чем крупнее пиксели) — тем больше света придется на каждый пиксель при съемке. А значит изображение будет более светлое и менее зашумленное. Оптимальный размер матрицы для разрешения Full HD (1920x1080) составляет ≥ 1/2,5“ (0,4 дюйма).

Камеры эконом сегмента дают низкое качество изображений с матрицы (шумы и помехи). В итоге такие изображения могут быть отброшены алгоритмами оценки качества, а более подходящих кадров может и не появиться.

Сравнение изображений с камер с низким и высоким качеством матрицы, а также с разными размерами матриц камер.
Сравнение изображений с камер с низким и высоким качеством матрицы, а также с разными размерами матриц камер.

К тому же матрицы более дешёвых камер могут раньше прийти в негодность, «подгорев» на солнце, что добавит дополнительные шумы и размытия на изображении, делая камеру бесполезной для распознавания лиц.

Пример изображения с дешёвой камеры, находящейся под прямым воздействием солнечных лучей
Пример изображения с дешёвой камеры, находящейся под прямым воздействием солнечных лучей

5. Производительность серверов видеоаналитики (перегрузка >80%)

Степень влияниявысокая.

Чем выше разрешение потока с камеры, больше людей на видео и больше потоков, поступающих на обработку, тем выше нагрузка на вычислители. Защита от падений при пиковых нагрузках заключается в том, что вместо полного прекращения работы система начинает отбрасывать часть подаваемых на анализ кадров. Это сохраняет ее работоспособность, но может приводить к тому, что удачные ракурсы лиц будут попросту исключены из анализа. В таблице ниже видно, что наращивание числа видеопотоков на сервер в какой-то момент начинает приводить к снижению FPS (числа кадров в секунду) с 25 до 17, а следовательно начинает падать и общее число идентификаций с 235 до 196.

Результаты нагрузочного тестирования
Результаты нагрузочного тестирования

6. Качество эталонных фото в базе

Степень влияниявысокая (31 ложная сработка на 1056 попытках).

Практика показывает, что если база сформирована из изображений лиц с качеством NIST Visa/Border, а с видеокамер приходят изображения лиц с качеством NIST Mugshot/Wild, то система будет работать эффективно и идентификации будут надежными. Если же в базе фото имеют качество приближенное к NIST Mugshot/Wild и хуже, то система будет выдавать больше ложных срабатываний.

Проверить качество можно с помощью автоматизированных сервисов, которые предоставляют вендоры систем распознавания лиц из списка NIST FATE Quality.

Пример оценки пригодности фото.
Пример сервиса оценки пригодности фото для использования в системе распознавания лиц

Как управлять внутренними факторами?

Влияние 6 внутренних факторов на эффективность систем распознавания лиц по видео
Влияние 6 внутренних факторов на эффективность систем распознавания лиц по видео
  1. Следите за качеством эталонных фото в базе, иначе повышается вероятность ложных идентификаций или пропусков.

  2. У спецслужб нет ресурса на отработку ложных идентификаций, поэтому принцип «‎не распознали на этой камере, распознаем на другой» позволяет повысить порог уверенности идентификации и, таким образом, сократить количество ложных сработок и не дискредитировать систему. Рекомендованный порог уверенности идентификации устанавливается так, чтобы сократить количество ложных сработок на базах более 500 000 лиц. Нужно оценить, какое количество людей будет проходить перед камерой в сутки, и решить, на какое количество ложных сработок будут готовы отреагировать пользователи (охрана, спецслужбы). Воспользовавшись графиком соотношения FAR/FRR (Вероятность ложной идентификации постороннего / Вероятность ложного пропуска искомого), который есть у каждого вендора алгоритмов распознавания лиц, можно выбрать оптимальный порог. Например, в наших испытаниях мы устанавливали порог 88%

    График соотношения FAR/FRR (Вероятность ложной идентификации чужого / Вероятность ложного пропуска искомого).
    График соотношения FAR/FRR (Вероятность ложной идентификации чужого / Вероятность ложного пропуска искомого).
  3. Высокое разрешение изображения с камеры не так важно. Лучше взять специализированную длиннофокусную камеру с меньшим выходным разрешением, но обеспечить крупные лица в кадре. Это сократит потребность в пропускной способности сети, потребность в дисковом пространстве для хранения видео и потребность в серверных мощностях для видеоаналитики.

    Проверить пригодность камеры для применения в задачах распознавания можно при помощи автоматизированных сревисов. Такие сервисы предоставляют вендоры систем распознавания лиц из списка NIST FATE Quality.

    Пример сервиса оценки пригодности камеры для использования в системе распознавания лиц
    Пример сервиса оценки пригодности камеры для использования в системе распознавания лиц
  4. Видео лучше обрабатывать на периферии (непосредственно на перекрёстках в местах установки камер) специализированными edge-устройствами вместо передачи «богатого потока» в ЦОД. Так сокращается риск потерь идентификаций из-за сбоев при передаче данных, сокращаются затраты на строительство и содержание линий связи, коммутационное оборудование, а также затраты на длительное хранение видео в ЦОД.

    В 2024 году МинПромТорг субсидировал производство промышленных компьютеров для использования в IoT при организации edge-архитектуры. В 2025 году мы ждем выхода в свет таких отечественных пыле- и влагозащищенные вычислительных блоков с графическими ускорителями, чтобы применять в задачах класса "Безопасный / умный город".

    А для подтверждения гипотезы на время испытаний мы собирали утеплённый шкаф с вычислительным блоком от Nvidia.

    Утеплённый шкаф с edge-устройством для обработки видео на периферии.
    Утеплённый шкаф с edge-устройством для обработки видео на периферии.

Заключение

Даже самую лучшую и "оскароносную" систему распознавания лиц можно сделать неэффективной, если не подходить комплексно к выбору и настройке всех компонентов, включая камеры, сервер видеоаналитики и сервера хранения данных.

Надеюсь, что результаты и материалы исследования помогут интеграторам систем видеонаблюдения с распознаванием лиц избежать ненужных ошибок при проектировании, монтаже и эксплуатации таких систем.

Комментарии (13)


  1. Rive
    13.01.2025 07:35

    К слову, задача распознавания лиц выдала в итоге настолько быстродействующие алгоритмы их поиска на изображениях, что их используют как очень дешёвую компоненту детализатора лиц в процессе генерации картинок (даже в комиксовом и аниме стиле).


  1. mahakala
    13.01.2025 07:35

    Не мог бы автор любезно ответить на следующие вопросы:

    1. Безопасна ли для прав граждан данная технология?

    2. Какими законами/подзаконными актами регламентируется данная технология?

    3. Давали ли свое согласие вышеупомянутые 528000 человек для использования фотографий своих лиц в этой технологии?

    4. Давали ли свое согласие вышеупомянутые 5500 человек для использования фотографий своих лиц в этой технологии?

    5. Хотел бы автор применения данной технологии к себе, к членам своей семьи, близким и друзьям?


    1. PashkovML Автор
      13.01.2025 07:35

      О, вы прям отличный список вопросов подготовили. Давайте разбираться:

      >> 1. Безопасна ли для прав граждан данная технология?
      Такая технология позволяет не только быстро находить и освобождать общество от опасных элементов (рецидивисты, террористы, убийцы и т.д.), но и поддерживает принцип "неотвратимости наказания" — не нарушай закон и прятаться не придется, а если идешь на нарушение, то будь готов что тебя быстро поймают и придется все вернуть/отплатить. Полагаю, что в целом для общества такая технология безопасна.

      >> 2. Какими законами/подзаконными актами регламентируется данная технология?
      >> 3. Давали ли свое согласие вышеупомянутые 528000 человек для использования фотографий своих лиц в этой технологии?
      >> 4. Давали ли свое согласие вышеупомянутые 5500 человек для использования фотографий своих лиц в этой технологии?

      На эти три вопроса я дам общий ответ. Если мы говорим о работе с биометрическими персональными данными, то нам в помощь:
      - ФЗ №152 Статья 11 «Биометрические персональные данные». Отсюда важен момент о том, что изображение лица (биометрия) может быть использовано без согласия человека в государственных, общественных или публичных интересах. А также если это изображение получено при съемке в публичных местах.
      - ФЗ №572 «Об осуществлении идентификации и (или) аутентификации физических лиц с использованием биометрических персональных данных». Отсюда важен момент о том, что вся обработка биометрических данных в коммерческих целях и в том числе идентификация лиц в системах видеонаблюдения в автоматическом режиме должна вестись только через ЕБС. Однако действие ФЗ не распространяется на обработку биометрических данных в рамках оперативно-розыскной деятельности, разведки и контрразведки, обороны, обеспечения безопасности и санитарно-эпидемиологического благополучия, миграционного, регистрационного и иных видов учета, а также на предприятиях критической инфраструктуры и топливно-энергетического сектора.  
      - ГК РФ Статья 158. Форма сделок. Отсюда важен момент о том, что получать письменное согласие на видеозапись не обязательно в помещениях достаточно таблички «Ведется видеонаблюдение» для обоснования согласия в форме так называемых конклюдентных действий (часть 2 статьи). С публичными и общественными местами еще проще — ограничений на ведение видеозаписи в публичных местах нет.

      Вот тут чуть подробне https://habr.com/ru/companies/tomhunter/articles/855120/ + https://kontur.ru/articles/1124

      >> 5. Хотел бы автор применения данной технологии к себе, к членам своей семьи, близким и друзьям?
      Честно — да. Я живу по чести. Не ворую, не избиваю, не убиваю. Мои нарушения изредка в превышениях скорости или краткосрочных задолженностях по налогам по невнимательности.

      В 90-е нашу квартиру обворовали, а в 20-е отца убили. Сейчас преступлений гораздо меньше, но даже сейчас я живу в таком районе, где наркоманы постоянно ищут закладки, а закладчика не могут поймать. И мне страшно отпускать ребенка на улицу и даже оставлять одного дома, так как некоторые нарки бывают агрессивные.

      Я бы хотел жить в стране, где преступник три раза подумает о неотвратимости наказания (и возможно передумает), прежде чем пойдет на преступление! А вам такого не хочется?


      1. MarvinD
        13.01.2025 07:35

        Абсолютно согласен.

        В магазинах камеры висят. Это не нарушение прав и свобод, а защита от воров и хулиганов.

        "528000 человек", выходя на улицу, уже свое лицо предоставляют неограниченному кругу лиц. Человек или его камера может их идентифицировать сколько душе угодно. Стой да идентифицируй.

        Сосед по даче, направив свою камеру в сторону вашего личного участка - это вопрос спорный, конечно. Но камера в калитке ворот на вашей даче - ваше право.

        И так далее.


  1. JBFW
    13.01.2025 07:35

    Вот так сидит человек, решает интересную техническую задачу, делает доброе дело, как он считает.

    А потом происходит что-то.

    Ну, скажем, "пандемия", и волевое решение руководства "гуляем по расписанию, ваш талончик на следуюшую неделю с 2 до 3 ночи", но вам нужно именно сейчас и по делу, а ваша же система, которую вы тщательно настроили, предательски записывает совершение вами "преступления"


    1. Frady_Priva
      13.01.2025 07:35

      Стоит оглянуться и посмотреть в каком мире мы живём, наши данные уже везде, к сожалению. Конфиденциальности уже нет


      1. JBFW
        13.01.2025 07:35

        так-то оно так, но во-первых, данные нужно еще найти и извлечь (к вопросу о распознавании лица Анонимуса на перекрестке ул.Ленина и К.Маркса), а во-вторых, ценность данных в их целостности.
        Не так ли, Тест Тестович Тестов, 2020 г.р., студент-электромонтажник Министерства Рыбной Ловли?


      1. anonym0use
        13.01.2025 07:35

        говорите за себя, не все сливают и сливали свои фоточки всюду куда вздумается


    1. Tyusha
      13.01.2025 07:35

      У меня к ограничений в пандемию гораздо меньше вопросов, чем к другим проявлениям нашего государства.


      1. JBFW
        13.01.2025 07:35

        ну зачем же всё перечислять, и так пример понятен )


  1. Omencast
    13.01.2025 07:35

    Спасибо за статью, прочитал с удовольствием как и первую часть. Для меня стало небольшим сюрпризом, что увеличение разрешение камер не всегда есть благо, всегда казалось что камера с бОльшим разрешением лучше будет справляться с идентификацией лиц, ведь детализация видео и фото у неё выше.


    1. PashkovML Автор
      13.01.2025 07:35

      Если что обращайтесь за экспертизой )


      1. northrop
        13.01.2025 07:35

        Интересуюсь знать, а как сейчас обстоят дела с распознаванием по силуэту и походке? Есть каки-то системы, уже работающие с этими данными?