В предыдущей статье мы обещали рассказать о двух новых способах реализации автоматического наведения PTZ-камеры на активного участника в переговорной комнате. Данный функционал существенно оживляет видеоконференции и избавляет от необходимости вручную переключать положение видеокамеры.

Напомним, что традиционным образом задача автонаведения реализуется с использованием конгресс-системы. Данное решение уже апробировано нами и внедрено в большом количестве проектов. В этом варианте микрофонные пульты используются не только для качественного захвата звука, но и для привязки координат “пресетов” видеокамеры к положению микрофонов в помещении.

К сожалению, не все участники совещаний приветствуют микрофоны на «гусиной шее», но при этом все желают оставить функционал автоматического наведения PTZ-камеры. В общем, это нас заставило задуматься над решением проблемы. И мы нашли два интересных варианта. Естественно, вам не придётся покупать Polycom Eagle Eye Director для этого, как бы вам предложили другие интеграторы :)

Первый способ


Итак, первый способ, назовём его полуавтоматическим, основан на применении специальных «кликеров». Преимущество такого способа в возможности использовать в переговорной комнате спикерофны или микрофонный массив, что позволяет говорящим не задумываться о том, куда говорить, голос будет захвачен в любом направлении. В общем, никаких “гусиных шей”. Для этого воспользуемся готовым комплектом, который состоит из следующих компонентов:

  • Центральный блок. Подключается к управляющего порту RS232/485 PTZ-камеры и передает управляющие сигналы для активации её приводов. Питание он получает через отдельный USB-вход, имеет компактные размеры и может быть спрятан за видеокамеру.


  • Непосредственно радиопередатчики управляющих сигналов («кликеры»), которые питаются от обычных ААА батареек. Они имеют на своем корпусе кнопку, по нажатии на которую происходит отправка команды на выбор нужного пресета для камеры в центральный блок и соответственно переключение видеокамеры в требуемое положение. В теории “кликеры” закреплены за конкретными сидячими местами в переговорной комнате, что позволяет точно настроить пресеты камеры.


На практике за “кликерами” нужно следить и ввести регламент по их использованию. Например, на каждом «кликере» указать номер пресета PTZ-камеры, к которому он «привязан», таким же образом разметить места за столом. Сам процесс настройки центрального блока тривиален и занимает от силы 10 минут для 8 “кликеров”. Работу решения можно посмотреть на видеоролике ниже.


В нашем случае используется опытный образец, поэтому внешний вид «кликера» далек от идеала. Нам бы хотелось узнать ваше мнение о таком решении. Интересно ли оно вам, стали бы вы использовать его в своих переговорных комнатах во время видеоконференций? Пишите в комментариях!

Второй способ


Второй способ более удобный, надёжный и инновационный! :) Он полностью автоматический и не нуждается в использовании отдельных устройств для привязки говорящего человека к пространству в переговорной комнате.

Наведение PTZ-камеры происходит по голосу, а именно по “лучу” или “лучам”, которые строит массив микрофонов, выделяя говорящих участников в помещении. Тут всё как у взрослых, только дешевле! У аппаратных производителей систем видеоконференцсвязи (Polycom, Cisco и пр) есть аналогичные решения, но их стоимость измеряется несколькими десятками тысяч долларов.

Нам пришлось написать специальное ПО и потратить много времени на его калибровку, чтобы воплотить в реальности этот способ. Итак, представляем вам UnitKit Medium, который состоит из следующих компонентов:

  • Микрофонный массив Phoenix Audio Condor, представляющий из себя 122 сантиметровую тубу, в которую встроен массив из 15 микрофонов. Кондор способен эффективно захватывать голос на глубину в 10 метров, что позволяет полностью отказаться от спикерфонов и проводов на столе в переговорной малого или среднего размера. Располагают его обычно под или над экраном.

    Во время своей работы кондор делит переговорную комнату на 9 секторов и отслеживает возникновение источников голоса в каждом из них одновременно. Именно эту особенность работы массива микрофонов мы решили использовать для создания нашего решения. Большое спасибо, разработчикам из Phoenix за предоставление интерфейса к DSP и адаптацию прошивки устройства под наши требования!



  • Поворотная PTZ-камера, поддерживающая протоколы управления VISCA/Pelco-P/Pelco-D. Характеристики видеокамеры, такие как кратность оптического увеличения, угол обзора, интерфейсы подключения, выбираются в соответствии с размерами помещения и другими параметрами [более подробно об этом мы рассказывали в предыдущей статье].

  • Активные динамики для подзвучивания помещения. Эти динамики или динамики, встроенные в телевизор, должны быть подключены к аудио выходу микрофонного массиву для анализа звуковой петли и подавления эффекта эха. Еще одним очень интересным вариантом для подзвучивания помещения является саундбар Yamaha . На сегодняшний день это единственное компактное решение, которое сертифицировано по технологии Dolby Atmos и выдаёт отличное качество звука.

  • И самое главное — спец. программа CleverMic Tracker, которая устанавливается на ПК (с Windows), к которому по USB-интерфейсу подключен массив микрофонов и через RS232/485 PTZ-камера. ПО в реальном времени с помощью некоторой магии анализирует и фильтрует направления “лучей”, создаваемых массивом микрофонов в процессе общения, чтобы избавить вас от головокружения при резких и ложных поворотах камеры. Вы скажите, Окей, одну координату (поворот) вы получили, а как выбрать приближение и наклон у камеры? Очень просто — они задаются вручную в интерфейсе ПО, после калибровки, которая позволяет установить соответствия “лучей” векторам на конкретные сидячие места за столом в переговорной комнате.

В итоге работает это следующим образом: Кондор определяет направление на говорящего, ПО ассоциирует его с вектором на ближайшее сидячее место и выдаёт команду на установку соответствующего “пресета” на PTZ-камеру.

Сейчас нами ведутся работы по созданию удобного интерфейса для программы. Программа будет поставляться бесплатно в составе комплекта UnitKit Medium. На следующем видео ролике показано как это работает.



Опять же нам интересно узнать ваше мнение: нравится ли вам данный способ автонаведения? Готовы ли вы использовать его в своих проектах?

Свое мнение можете оставлять в комментариях к данной статье или адресовать напрямую автору статьи, Татьяне Усиковой, usikova@unitsolutions.ru
Поделиться с друзьями
-->

Комментарии (6)


  1. SADKO
    25.07.2017 10:43

    ИМХО «кликер» рулит, давая возможность управлять «фокусом внимания зрителя» по мере необходимости…
    … и тут начинается самое интересное, ведь видеоконференции используются в разных ситуациях, и в одних случаях управление имеет управленческий смысл и управленцы его любят и ценят, в иных-же напротив, установка «общего плана» дабы озирать всю переговорную и всех находящихся в ней, вопрос корпоративной этики…

    Я не буду стебаться над кондором, хотя имею на то полное право, но кейс автоматического управления от него, очень ограничен в применениях, ибо если говорят двое, а третий эпизодически делает ремарки, это скакание камеры, как-бы вам сказать… А такие ситуации реальны и иногда имеют управленческий смысл.

    В общем, я бы начинал с изучения практических потребностей, типовых внутренних и внешних переговоров и их психологии.


    1. UnitSolutions
      25.07.2017 13:39
      +1

      Спасибо за ваш отзыв! Кондор достаточно популярен — только в России мы продали несколько сотен устройств. Кроме того, от клиентов часто слышали запрос на функционал автонаведения камеры по лучам. Потому и сделали данный кейс.


  1. Vitalley
    25.07.2017 13:19
    +1

    Посмотрел видео… ещё было бы интересно работать с трансфокатором камеры, когда она настроившись приближает изибражение, а когда объект не определён или происходит перенаведение переходит на общий план.


    1. ganelion
      25.07.2017 18:03
      +1

      Не очень понятно что вы имеете в виду… Можете расписать свою мысль более подробно?


      1. Alexmaru
        25.07.2017 23:14
        +1

        говорят двое — вы делаете медленный принудительный зум-аут, смотря в сторону говорящих, если они рядом. Если говорят все — полный зум-аут. Если говорит один — внисание на него. Если не говорит никто — общий план, если говорит телевизор — общий план. Примерно это он хотел сказать.


        1. Vitalley
          27.07.2017 14:37
          +1

          Очень хорошо описано, добавлю только переход с одного спикера на другого тоже через зум-аут и зум-ин.