В этой статье я хотел бы рассказать о созданной мной технологии по формированию объемного звука в наушниках, при помощи размещенных в разных плоскостях системы динамиков. Как говориться, всё новое это хорошо забытое старое, и начать пожалуй стоит с небольшой истории развития.
Так, в 1979 году, советской фирмой «Электроника» была выпущена модель наушников с квадрафоническим воспроизведением звука под названием «ТДК-6».
В наушниках закрытого типа были размещены две стерео-пары динамиков под небольшими углами к уху слушателя. Одна стерео-пара воспроизводила фронтальную звуковую панораму, вторая - тыловую. За счет угла наклона и смещения динамиков относительно слухового канала, АЧХ фронтальной пары отличалась от тыловой, благодаря чему появлялся эффект объемного звука. Но, к сожалению модель не получила большой популярности, на мой взгляд из-за малого количества контента и отсутствия бинаурального эффекта, на тот момент звуковой канал выводился напрямую, без каких-либо обработок. Левое ухо было изолировано от правого, плюс отсутствие временных задержек.
С начала 2000-х, индустрия компьютерных игр и многоканальных звуковых карт ПК получила стремительное развитие. Большой популярностью стали пользоваться системы домашнего кинотеатра в новом звуковом формате 5.1, разработанным компанией «Dolby Labs». Большинство фильмов и видео-игр выпускалось с поддержкой объемного звука. Но не всем покупателям было удобно размещать такие систему у себя дома, плюс высокая стоимость внешней многоканальной аудиосистемы была не каждому по карману. В связи с этим, на рынке стали появляться наушники с поддержкой многоканального аудио от различных фирм производителей.
Так, американская компания «Roccat» выпустила свой продукт Roccat Kave XTD 5.1 Digital , во многом схожий с «ТДК-3», но уже с улучшенной эргономикой и динамиками более высокого качества, уже под новый, пользующийся популярностью формат Dolby Digital 5.1.
Схема аналогична ТДК-3, динамики размещены к уху под небольшими углами, в закрытой акустической камере и разделены на фронтальную и тыловую стерео-пары . Конструкция имеет закрытый тип . К наушникам в комплекте уже шла своя звуковая карта, с прямым выводом каналов на динамики. Объём также достигался за счёт расположения динамиков под углами и смещения относительно слухового канала.
Компания «Zalman» также выпустила свой продукт, куда входили наушники с объемным звуком 5.1 «Zalman ZM-RS6F» и усилитель «Zalman ZM-RSA». Однако, большой популярностью модель не пользовалась из-за слабо выраженного эффекта 3D.
Еще одной моделью начала 2000-х были наушники «HTS-168VI» от компании «Cosonic». Звук также выводился напрямую, в формате 5.1, наклон излучателей был выполнен в обратную от уха сторону. Корпус наушников был сделан открытого типа, что давало хороший пространственный эффект.
Позже, с развитием звукового формата, стали появляться игровые гарнитуры под новый звуковой формат 7.1 .
Так, в 2016 году компания «Asus» выпустила на рынок модель гарнитуры «ROG Centurion 7.1» c отдельной звуковой картой, в которой звуковые каналы также выводились на свой отдельный драйвер. Инженеры компании разместили излучатели уже в одной плоскости, отказавшись от наклона. Объем формировался уже только за счёт смещения динамиков.
А в 2020 году последовала доработанная модель «ROG Theta 7.1» со встроенной звуковой картой, увеличенным размером драйверов и улучшенной элементной базой. Но, несмотря на серьёзную рекламную кампанию, продукт провалился в продажах и был снят с производства. Причинами могли стать низкая эргономика, высокая стоимость и слабо выраженный эффект 3D.
Аналогичную модель выпустила американская компания Razer. С небольшой разницей размещения драйверов. Продукт постигла та же участь, что и Asus. Несмотря на широкую рекламную кампанию и обилие наград от различных изданий, потребитель отнесся к продукту весьма скептически, объемный звук получился весьма посредственным .
В чём же проблема всех этих моделей ? Для ответа на этот вопрос, следует обратится к теории бинаурального восприятия звука человеком. Основными факторами, формирующими пространственное позиционирование, являются угол падения звуковой волны и разность АЧХ и ФЧХ между правым и левым ухом.
Угол падения задает саму АЧХ, вследствие дифракции волны о ушную раковину, слуховой канал и угол относительно барабанной перепонки от источника. Один и тот же источник звука будет иметь разные АЧХ в зависимости от положения в пространстве, это можно выявить простым лабораторным способом, делая замеры, скажем с мониторного динамика относительно головы-манекена, имитирующего слух. Второе же ухо будет иметь отличающийся график от первого, за счёт той же дифракции плюс временная задержка обусловленная расстоянием между ушей. Возможно, ассоциация позиции и АЧХ заложены в нас природой, все звуки сзади имеют характерный провал в районе 3-4кГц.
Так вот, во всех перечисленных выше моделях, АЧХ с каждого из динамиков не соответствуют позиции звука, обусловлено это несколькими факторами: несоответствием угла падения из-за одного бокового размещения диафрагм излучателей. Безусловно, смещение дает эффект но график остаётся далёк от лабораторного. Второй момент - отсутствие второй половинки, неотъемлемой части бинаурального восприятия. То есть правый боковой канал подается только к правому уху, когда в реальности мы звук сбоку воспринимаем обоими ушами. И третий - отсутствие временных задержек, обусловленных расстоянием между ушами.
После провала мультидрайверных моделей, широкое применение получила технология виртуализации многоканального аудио в стерео-наушниках. Как от крупных компаний: DTS Headphone X, MS Sonic Audio, Dolby Atmos for Headphones, Creative Super X-Fi, так и сами производители наушников начали выпускать своё фирменное ПО, появились даже бесплатные программы-эмуляторы, позволяющие на одном ПК применить любую из технологий HeSuVi + EQ APO .
В основе данного метода лежит программная эквализация базовых АЧХ наушников до АЧХ виртуальных каналов, в зависимости от положения источника звука относительно головы слушателя, это могут быть как фиксированные 5.1, 7.1 так и динамические источники, например как у Dolby Atmos for headphones .
Позиционирование звука после такой обработки слышится более отчётливо, чем в дорогих и громоздких мультидрайверных наушниках.
Но у такой модели несколько существенных недостатков:
Из-за бокового расположения динамика, практически не учитывается уникальная форма ушных раковин и преобразованный звуковой сигнал у разных людей не сходится с их природным восприятием, что порой приводит к несоответствию с позиционированием звуковых объектов в виртуальном пространстве. Сейчас применяются технологии сканирования уха, но на результат пока что они влияют не существенно
Множественные изменения звука при программной обработке, микширование нескольких каналов со своими АЧХ и временными задержками на одну диафрагму, даёт искажения, что приводит к значительной потере реалистичности звуковой панорамы. Особенно это становится выраженным при прослушивании музыки.
Программная эмуляция жёстко привязана к АЧХ наушников. В разных наушниках получается разное позиционирование.
Насколько мне известно, кибер спортсмены да и обычные игроки, холодно отнеслись к виртуализации, предпочтя качественное стерео.
Исходя из всего этого, я задумался над созданием модели, которая исправит все эти недостатки.
Модель «Сфера» .
Прежде всего, я исправил недостаток мультидрайверных наушников, разместив динамики в соответствии с направлением источников звука. За базовые направления принял фронтальную, боковую, тыловую, а также верхнюю и нижнюю плоскости. От амбушюр решил отказаться в пользу ортопедических к голове, тонких силиконовых прокладок, с тем чтобы ухо было максимально погружено в акустическую камеру и находилось между динамиками. Таким образом, каждый динамик будет иметь свою АЧХ, обусловленную дифракцией звуковой волны о геометрию ушной раковины, слухового канала а угол падения соответствовать источнику.
Задача совместить несколько динамиков в малом пространстве оказалась непростой. Первые прототипы давали сильный резонанс, несмотря на все усилия по демпфированию. Решение оказалось простым. Акустическую камеру, как и внешний корпус я сделал открытыми. А чтобы не допустить акустическое замыкание, был применён специальный материал, пропускающий воздух. Сами динамики были взяты типовые, которые широко применяются в бюджетных стерео наушниках, 40 мм 20 Гц-20 кГц, 96 дБ, 20 мВт, 32 Ом. Динамики соединены в стерео-пары фронтальных, боковых и тыловых каналов и подключены к соответствующим аналоговым выходам звуковой карты Creative SBX-3 в формате 7.1 . Каналы выводятся напрямую, в режиме direct, в обход звукового процессора. Центральный канал перенаправлен на фронтальную стереопару при помощи программного микшера.
Целью дальнейшего R&D является разработка внешнего блока электроники, который позволит:
Избавиться от необходимости дополнительного приобретения к наушникам звуковых карт и прочих устройств.
Помимо ПК, подключаться через цифровые интерфейсы к различным устройствам, ТВ, ресиверам, игровым консолям.
Адаптировать многоканальный формат к бинауральному восприятию, с помощью встроенной программной прослойки.
Силиконовые, либо гелевые прокладки с тканевой поверхностью обеспечат максимальное погружение уха в камеру и комфорт.
Конечно, качество объемного звука сложно измерить оборудованием. Для этих целей мы приглашали целевую аудиторию, это обычные люди, любители компьютерных игр. Для сравнения использовалась модель близкого аналога Asus ROG Theta 7.1 c прямым выводом многоканального звука, а также стерео-наушники Sennheiser HD 569 c виртуализацией 7.1 через встроенный в звуковую карту Creative SBX-3 процессор DSP. Было опрошено порядка 12 человек, тесты проводились в различных современных играх, кино и музыке. По отзывам, модель «Сферы» обеспечивает более реалистичный и качественный объем.
Также были проведены измерения по стандарту IEC-60268-7 в московской лаборатории reference-audio-analyzer.pro .
На графике чётко видна разница АЧХ между каналами, причем сигнал выводится напрямую без-каких либо обработок. Она обусловлена различными углами падения звуковой волны на микрофонную мембрану от излучателей, расположенных с разных сторон относительно уха, а также дифракцией звуковой волны о поверхность ушной раковины, в данном случае манекена.
Для обеспечения бинаурального эффекта в наушниках, не достаточно просто подвести прямые канальные сигналы 7.1 к системе динамиков, так как левые и правые каналы изолированы друг от друга и воспринимаются по отдельности, в то время как в реальности любой источник мы слышим обоими ушами.
Для решения данной задачи планируется разработка программной прослойки, которая добавит вторую «теневую» половинку к противоположным канальным прямым сигналам, что в итоге должно дать бинауральный эффект.
Для получения параметров теневых каналов планируется провести исследования следующего плана:
В безэховой камере, с помощью анализатора - манекена имитирующего человеческий слух, и источника звука мониторного типа, с микрофонов будут проведены замеры АЧХ слышимого прямого и теневого звуковых сигналов с определенных для статичных систем 7.1 позиций и углов сведения - 30, 90 и 120 градусов. В итоге, для каждого канала получится два разных графика АЧХ, прямой и на противоположной стороне - теневой. Далее, исходя из соотношения амплитуд по каждой из частот, между прямым и теневым замером, выявить коэффициенты и перенести их при помощи эквализации на соответствующие каналы наушников, добавив при этом необходимые временные задержки. Таким образом, мы получим полноценный бинауральный эффект.
Для реализации полного потенциала «Сферы», необходимо создать математическую модель рассчитывающую динамическое изменение АЧХ и ФЧХ источника звука в любой точке пространства, применимую к человеческому бинауральному восприятию . Для этого планируется лабораторным способом произвести замеры АЧХ в сферической области вокруг головы манекена и исходя из изменений в разных точках пространства, достаточно будет для одного уха за счет симметрии и выявить закономерность через формулу, либо сделать привязку эквализации в фиксированных точках пространства к полученным коэффициентам. Далее, исходя из полученных данных, программа будет вычислять АЧХ и временные задержки и выводить на соответствующие заданному пространственному сектору динамики. Система из 10 динамиков будет обеспечивать полный звуковой охват, включающий в себя основные звуковые панорамы фронтальной, тыловой, боковой, а также верхней и нижней плоскостей. Таким образом, будет достигнут полноценный эффект 3D для бинаурального восприятия звука.
Основные преимущества модели Сфера:
Физическое размещение излучателей вокруг уха в базовых шести плоскостях - фронт, тыл, бок, и в дальнейшем верх и низ, позволяет обеспечить качественное трехмерное позиционирование, являясь своеобразным 3D проектором звука.
Строение уникальной ушной раковины, слухового канала и угла наклона барабанной перепонки у каждого слушателя учитывается естественным образом, нет необходимости сканировать ухо и делать сложный расчёт изменения АЧХ каждого канала за счёт дифракции звуковых волн.
Применение открытого типа конструкции как внешнего корпуса так и акустической камеры, позволяет избавиться от внутренних резонансов, а также добавляет ощущение открытого пространства. Распределение каналов по отдельным драйверам, в отличии от микширования на один излучатель нескольких виртуальных каналов в стерео-наушниках, позволяет снизить нагрузку на диафрагму, а звуковой сигнал идёт напрямую, без многочисленных обработок, что в итоге благоприятно сказывается на реалистичности звуковой панорамы. Становится комфортным слушать даже музыку, что открывает новые горизонты для целого направления электронной 3D музыки.
И ещё один очень важный момент. Виртуальные каналы также будут присутствовать и у «Сферы», они просто необходимы для точного позиционирования источника в любой точке пространства. Но основным отличием от стерео наушников, будет гораздо меньшая эквализация, за счёт того, что динамики уже развёрнуты в необходимых плоскостях. А чем меньше преобразований, тем меньше искажений, и как следствие - реалистичный, приятный для слуха звук.
На данный момент, пытаюсь найти средства для реализации проекта, участвуя в гос.конкурсе «Фонда Содействия Инновациям». Возможно кого-то из Вас заинтересует моя идея. Пишите, звоните, буду рад пообщаться.
С уважением,
Николай
разработчик
e-mail: technicno15@gmail.com
+7(909)-251-97-77
Комментарии (4)
ProLimit
02.09.2022 12:07А в чем смысл проекта, просто ради интереса? Коммерческий успех ему не грозит, вы сами привели примеры и причины, из-за которых подобные проекты провалились в продаже. Причины у тут останутся такими же. Для hi-end музыки - просто нет и вряд ли будет материал с пространственной многоканальной записью. Единственное реальное применение - это синтезируемые в риалтайме звуки в играх, но там сейчас хватает и стереонаушников, так как бинаруальные алгоритмы уже достаточно неплохо справляются, звук отлично позиционриуется в 3D, в том числе различается верх/низ. А простота, дешивизна и высокое качество стереонаушников для геймеров полностью закрывает их потребности.
3DSound Автор
02.09.2022 15:53У бинаурального звука есть серьёзные проблемы с искажениями, о которых я писал в статье. Также и с позиционированием, за счёт того, что программа не учитывает индивидуальную форму уха и слухового канала. Моя модель решает эти проблемы.
Jury_78
На мой не профессиональный взгляд... Расстояния не большие и все может сильно зависеть от индивидуальных особенностей человека, например формы ушей.
3DSound Автор
Да, вы правы. Манекен не может эмулировать слух всех людей и является лишь эталонной моделью, точкой отчёта для исследований изменения АЧХ в разных точках пространства. Расстояние так же будет влиять на аплитуду, но изначально, важно выявить закономерность изменения АЧХ в определённом радиусе.