Это система, которая улучшает звук любых наушников, повышает пространственную реализацию и практически реализует КИЗ.
«Любая достаточно развитая технология неотличима от магии», — Артур Кларк.
Вступление
Пожалуй, с этих слов я хотел бы начать свой небольшой рассказ о том, как на протяжении долгого времени хотел получить наилучший звук. Наверное, многие из вас слушали когда-нибудь хороший симфонический оркестр или, предположим, хотя бы знакомого, который играл вам какие-нибудь песенки. Мне всегда хотелось повторить этот натуральный, живой звук. Я начал собирать свою стерео-систему, в которой было множество различных аппаратов/форматов и других устройств. Примерно полгода назад я начал осознавать, что на звук очень сильно влияет помещение (а точнее эхо, реверберации комнаты и т.д.). Именно комната создавала гудение на низких частотах и невнятность на высоких. И я начал решать этот вопрос.
Первое, что пришло в голову — это понижение эха в комнате путём различных ловушек и подобных способов. Да, это действовало, но должного результата я так и не смог добиться. После были другие многочисленные способы, но и там ничего хорошего так и не получилось.
Тогда я решил: почему нельзя использовать наушники? Ведь там эхо равно практически нулю, вдобавок не буду мешать близким, могу наушники брать в поездку, не говоря уже о их малом весе и компактности.
Всё было бы хорошо, но в наушниках было очень мало объёма звука, не хватало сцены и ширины «пространства». Это надо было решать...
Я затестил большое количество софта, который был создан для того, чтобы получить объёмный звук, но все они работали странно, давали сильные искажения, и к тому же то самое нелюбимое эхо. Тогда обдумав всё, я решил создать собственную систему объемного звука. Назвать её было решено “DSystem”(дсистем).
Итак, со вступлением закончено, можно теперь перейти к тому, как работает моя система. Начнём!
Обеспечение пространственной панорамы, разборчивости и выделения сигналов на фоне других сигналов и шумов является важнейшей задачей звукорежиссера при записи и обработке звука, а поскольку это требует использования бинауральных свойств слуха, то анализ этих свойств и есть цель данной части.
Для начала надо понять, как человеческий слух определяет, откуда идёт звук. Наличие двух приемников слуха (ушей) обеспечивает человеку возможность воспринимать пространственный звуковой мир и оценивать перемещение звуковых сигналов в пространстве. Информация, которая поступает на оба слуховых канала, обрабатывается в периферической части слуховой системы (подвергается спектрально-временному анализу) и затем передается в высшие отделы головного мозга, где путем сравнения этой информации из двух разных каналов формируется единый пространственный слуховой образ.
Погрешность оценки азимута источника звука в горизонтальной плоскости спереди составляет 3...4°, а сзади и в вертикальной плоскости — примерно 10...15°, что объясняется экранирующим действием ушных раковин. Для человеческого слуха очень важна временная и интенсивная разность. Начнем по порядку:
Временная разность, это разность, которая работает на таком принципе, что звуковая волна доходит до правого и левого уха в разное время (из-за скорости звука в воздухе, причем температуру учитывать тоже надо), за счет этого наш мозг определяет, с какой стороны идёт звук.
Интенсивная разность — это когда звук в одном ухе более громкий, чем в другом, мозг будет воспринимать сигнал там, где громче. Наибольшая разность уровней звуковых давлений, действующих на левое и правое ухо, возникает при боковом положении источника (90°). К примеру, писк комара над ухом. Также на высоких частотах появляется эффект «акустической тени» — это когда голова образует препятствие, и по ВЧ уровень падает. (см. Ирина Алдошина — «Основы психоакустики». Книга очень крутая, всем рекомендую).
Также существует технология HRTF и HRIR(в общем, это эмуляция звука ушной раковины, т.е. ушная раковина под различными углами имеет разное АЧХ и ФЧХ. Благодаря этому человек также определяет, где, что и как расположено). Я её изучал, но особого эффекта она не дала, и в тоже время неплохо искажала звук. Решил пока что без неё (кому интересно, прошу почитать, интересная статья).
Реализация:
У нас есть два уха. И два динамика в каждом ухе. Теоретически, мы можем извлечь из звукового файла канал, предположим, для правой АС, и создать описание того, как будет идти звук до правого уха и до левого. Потом это всё дело вживую обрабатывать «на горячую» и получать эмуляцию идеальных АС в безэховой камере. У такого способа еще и реверберации нет. А объем есть.
PROFIT!
А теперь на примере. Предположим у нас есть сигнал(к примеру, барабан), мы берем сигнал с левого канала, благодаря особым расчетам получаем, что сигнал будет идти до правого канала на 0.0003 с дольше (используем задержки как в автозвуке или в домашних кинотеатрах), снижаем все частоты канала с обработкой до 1 кГц на -6 дб, а после 1 кГц — на -9 дб. и отправляем это всё в правый канал наушников. (Это всё было сделано практическими расчетами. ВАЖНО: учитывать расстояние между ушами (у меня сейчас оно 13.5 см) и расстояние до воображаемых АС. Можно также учитывать температуру воздуха).
Иии... это сработало!!! С хорошими наушниками получилось полностью забыть про то, где находятся динамики, звук крутится вокруг головы, и удовольствие от музыки есть. А самое главное — никакого эха. Я решил написать небольшой плагин, который пока что в стадии разработки, но иными путями (через аудиоредакторы) я смог получить файлы с музыкой разных жанров. И они где-то тут должны появиться.
По сути, в ближайшем будущем хочу дописать VST плагин, и дальше развивать проект.
На данный момент это всё выглядит так:
В заключение всего вышесказанного хотелось бы отметить, что в будущем по этому проекту будут ещё доработки и т.д. и т.п.
Жду критики и предложений! Спасибо за внимание!
Информация:
Ирина Алдошина - Основы психоакустики
Комментарии (41)
modelair
19.07.2023 15:43судя по описанию процесса вы сделали Waves Abbey Road Studio VST.
в таком плагине можно регулировать все углы, выбирать тип помещения, студии и наушников
Hidden text
и споровождающий headtracker - следим за твоей головой через камеру.
amir_ad_dainl Автор
19.07.2023 15:43Я обязательно попробую с ним "поиграться", но как я понял цель у этого плагина иная. У нас есть аналог "Realphones". Смысл этих планов реализовать звук как в студии. Т.е. с реверберации студии, с недостатками мониторов(вплоть до импульсов динамиков), если предположим выбрать какой-то маленький полочный монитор, то у него будет провал по басу и т.д. Я возможно ошибаюсь, но если мои предложения верны, то тогда цели наших проектов разнятся. Я стараюсь создать модель идеальных АС в безэховой камере, нежели повторить все недостатки или плюсы определенных мониторов в определенном помещении.
homeles
19.07.2023 15:43+1Не совсем понял.... Вы берете 2-дорожечную запись (стерео), в которую на студии сводили НН-ое количество инструментов-голосов и распределяли по дорожкам (звукорежиссер на пульте "днями-ночами" корпел, чтобы это все слушалось адекватно.... И что вы хотите получить - чтобы студийная (грубо - помещение 6х6 метров, да еще и иногда отдельно записанные партии) запись звучала как концертная - где инструменты по сцене разбросаны (и все равно звукорежиссер на основном пульте делал 2 дорожки под стерео) ? Как быть с "творческими" приемами звукорежиссеров по задействованию стерео-эффекта, когда звук одного источника может перемещаться из "одного уха в другое"
amir_ad_dainl Автор
19.07.2023 15:43+2Смысл не в этом. Вот слушали когда-нибудь хорошую акустику? Если да, то точно замечали то, что сцена перед вами. Т.е. перед вами две колонки, а звук между ними. (к примеру вокал). В наушниках, вы не слышите что звук спереди. Он как-бы внутри головы, от этого я стремился избавиться. По поводу "стерео-эффекта", за частую сведение происходит на АС и различные стерео-эффекты могут звучать иначе. К примеру, тот же Jean-michel jarre( oxygen pr.2 в музыке которую я кинул). На колонках мы слышим что звук играет только с левой АС(предположим). а в наушниках будет ощущение, что мы оглохли на одно ухо, а звук не просто справа.
https://www.youtube.com/watch?v=N-aK6JnyFmk послушайте это в наушниках и поймете о чем я говорю. Если еще что-то не понятное, спрашивайте, попробую объяснить.
gluck59
19.07.2023 15:43Тоже обратил на этот момент внимание, но потом предположил — что гарантировано испортит условный джаз, то ведь вполне может улучшить условный "рэпчик"?
Anzorik_228
19.07.2023 15:43+1Не хватает конкретики, довольно скудно описаны вещи, о которых интересно было бы почитать:
Первое, что пришло в голову — это понижение эха в комнате путём различных ловушек и подобных способов.
Почему бы не написать что именно было использовано? Есть несложное решение, требующее небольших затрат, предлагайте!
Также существует технология HRTF и HRIR...
Если вы уже упоминаете различные серьёзные темы, технологии и т.д. следует говорить уже развёрнуто что есть что, не обрывая энтузиазм на корне.
А теперь на примере. Предположим у нас есть сигнал(к примеру, барабан), мы берем сигнал с левого канала, благодаря особым расчетам получаем, что...
Где этот пример!? Зачем предполагать сигнал, если вы в своём примере использовали что-то конкретное с конктретными значениями или диапазом значений? "Благодаря особым расчётам", следует всегда конкретно показывать, что вы делали и доказать наглядно, что у вас получилось. Повторюсь, нет конкретики
Иии... это сработало!!!
На будущее, вы можете не знать, однако скептицизм людей не знает границ, особенно пользователей Хабр, так как всегда на статью найдётся пользовать, знающий больше Вас. Результат показан только на слове "заработало"
А так — нормальная статья, довольно поверхностная, на уровне реферата для колледжа/лицея.
С грамотностью у автора проблемы, но это сейчас скорее правило, чем исключение.
amir_ad_dainl Автор
19.07.2023 15:43+1Большое спасибо за развернутый комментарий, с указанием на ошибки. Действительно, где-то я написал не очень конктретно, планирую исправится. По поводу "результат показан только на слове заработало", я добавил ссылку на яндекс диск, где музыка с этой обработкой, можно заценить. Собственно говоря, я задумываю чтобы эти моменты как-нибудь скорректировать. Ещё раз спасибо!
simenoff
19.07.2023 15:43+1Звук классный получился
amir_ad_dainl Автор
19.07.2023 15:43Если это с моей системой, пожалуйста, прошу указать ее название "Dsystem". Дабы была какая-то информация по этому поводу. Если желаете, могу еще музла на диск закинуть, какого пожелаете, перечислите список только )))
simenoff
19.07.2023 15:43Можете эти треки обработать?
amir_ad_dainl Автор
19.07.2023 15:43Чот много, я устану столько делать.... Давайте штучек 5 - 10 самого интересного... Или ждите когда я плагин выпущу(а это где-то еще месяц)
Hledacek
19.07.2023 15:43Послушал "музло" на моем сетапе состоящим из "хороших наушников" и отдельного усилка. Голова болит, звук размазан, но источник все равно находится между левым и правым излучателем.
amir_ad_dainl Автор
19.07.2023 15:43-1Интересно интересно... Расстояние между ушами какое у вас? Возможно, это сыграло роль.
Hledacek
19.07.2023 15:43от края до края уха 16см, наушники с глубокими чашками, еще по 2 см с каждой стороны до самих динамиков
amir_ad_dainl Автор
19.07.2023 15:43Вооот... Это шире стандарта, возможно когда-нибудь выложу файлы под разные головы
1Fedor
19.07.2023 15:43Успехов, может что и получится
книга действительно толковая, много лет назад делал акустику пользовался ("Ирина Алдошина — «Основы психоакустики». Книга очень крутая, всем рекомендую")
Имею возможность сравнивать различную акустику и наушники, наушники в общем-то суррогат, звучащий внутри головы. Звук формировал звукорежиссер, а Вы примочками меняете,(кстати, мне по этой причине не нравятся различные эквалайзеры) можете не понять почему так сделано (в альбоме The Wall вертолеты летают)amir_ad_dainl Автор
19.07.2023 15:43Спасибо, я стараюсь делать все по расчетам, нежели на слух. Т.е. я не меняю тупо на слух как мне хочется, а стараюсь сделать всё, что как будто бы музыка слушается на реальных АС.
iskatel
19.07.2023 15:43+3Вы не 1й, не 10й и даже не 21й, кто попытались этим заняться.
У одних получалось чуть лучше, у других хуже, но в целом все попытки искусственно улучшить "объёмность" в наушниках , которые по сути представляют собой намеренное искажение сигнала в попытках сымитировать помещение - плохи. Уж лучше слушать совсем без них.
Хорошие результаты даёт 1 технология : бинауральная запись на пару стереомикрофонов в имитаторе головы, и последующее воспроизведение.
Тк. такую стереозапись особо не обработаешь (не многодорожечная), то у метода очень высокие требования к помещению , игре музыкантов и работе звукорежиссёра.
Но если сделано хорошо, то в наушниках отлично звучит, передача пространства на высоте. Послушайте, например от Chesky records.
amir_ad_dainl Автор
19.07.2023 15:43Обязательно изучу. Конечно, это будет звучать не как полноценные АС, но во всяком случае, результат который сейчас есть, мне нравится. Надо будет проводить замеры ещё...
vadimk91
19.07.2023 15:43Прочитал про "объемность" и вспомнил, что далёких 80-х собирал схему для получения псевдостерео сигнала из моно. Принцип был простой - получить сдвиг фазы на 90 градусов между каналами. Конечно, достичь этого в широком диапазоне частот на аналоговой схемотехнике трудно. Результат какой-то был, но он мне не понравился совершенно, "улучшайзер" был заброшен в дальний угол кладовки. Сейчас конечно все можно сделать гораздо аккуратнее, та же технологии BBE от корейской Cowon была в свое время прорывом для MP3 плееров.
amir_ad_dainl Автор
19.07.2023 15:43Мне кажется этот "улучшайзер" был придуман для каких-либо простых магнитофонов(класса 3-его), но не для высококачественной аппаратуры.
gluck59
19.07.2023 15:43А ведь и не надо было крутить фазу у всего диапазона... насколько помню, для псевдостерео диапазон этот сужали.
economist75
19.07.2023 15:43Музыканты и звукорежиссеры имеют неограниченный доступ к контрольным студийным мониторам/колонкам/наушникам и подготовленным помещениям, то есть ко всему, имеющему и дающему высокую достоверность звучания, 1:1.
И вот ведь парадокс: нам, звукорежам, слушать чужую известную музыку (условный Pink Floyd) на студии не так комфортно, как, скажем, дома, или в просьюмерских наушниках. Хотя на студии и кресло удобнее, и не мешает никто, и любимый напиток под рукой.
Так в чем дело? - Думаю, виной именно та самая "высокая достоверность", подчеркивающая ляпы, плоская, детальная. Поэтому я верю в софтовые возможности улучшения звука через его небольшое, дозированное и научно обоснованное "ухудшение". Я слышу как работают лампы, софтовые сатураторы - и в некоторых случаях это приятное дополнение к хорошей музыке. Гармониками дело не ограничвается.
Но рыночной потребности (и тем более инженерной необходимости) в таких технологиях, боюсь, нет. Есть лишь небольшой рынок экстремальной аудиофилии, базирующийся на заговорах и оверпрайсе во всем. Ждем нобелевку по аудиофилии, или научную работу, оценивающие удовольствие от прослушивания вербальным путем, по динамике серотонина, ЭКГ, "мурашкам" по коже итп проявлениям удовольствия. Вот тогда будет ясно куда двигаться (и можно ли).
amir_ad_dainl Автор
19.07.2023 15:43Отчасти с вами согласен, но я придерживаюсь студийного звука. Мне он доставляет наиболее большой кайф. Возможно это я такой особенный(каждый слух индивидуален), но пока-что вот так.
simenoff
19.07.2023 15:43Я так понимаю идёт имитация прослушивания акустики в безэховой камере (бесконечно открытом пространстве)?
sergerz
19.07.2023 15:43Когда-то в 80-х годах читал описание аппарата с несколькими колонками. Звук из правого канала попадает в правую колонку, потом с задержкой в колонку, которая стоит чуть левее, и так во все колонки с небольшой задержкой. Аналогично левый канал попадает в левую колонку, потом с задержкой в колонку стоящую правей и так далее, до правой колонки. Получается стереокартина по всему фронту между колонками, ну и много интереснее, как там писали. Сделать качественное воспроизведение в тех условиях было почти невозможно, а сейчас вполне реально и недорого.
StpMA
19.07.2023 15:43+1Зачем вам температура? У вас с правое ухо на солнышке? Можно вообще весь прогноз погоды подтягивать. Там и давление, и влажность...
amir_ad_dainl Автор
19.07.2023 15:43-2Температура воздуха влияет на скорость звука(см. картинку), влажность тоже следует учитывать, т.к. она тоже влияет.
debagger
19.07.2023 15:43Недавно смотрел видео, тут очень хорошо объяснено, как добиться объемного звучания при сведении.
Hidden text
melodictsk
19.07.2023 15:43Сдается мне все эти фокусы давно реализованы в драйверах звуковых карт. Я помню ещё как у ауреал 3д это все было и можно было настроить, потом переползло в креативы, и вроде это есть в асусах. Посмотрите, попробуйте.
3DSound
19.07.2023 15:43+1Здравствуйте, коллега. Я также занимаюсь разработками в области объёмного звука, только для многоканальных акустических систем (статейка). Идея бинаурализации стерео-записи для воспроизведения в наушниках увы, не нова. Но это не означает, что никому не нужна и бесполезна. Она позволит выйти звуку за пределы головы слушателя.
Но тут есть ложка дёгтя:
Каждый человек имеет свою уникальную форму головы и ушей, и бинаурализация стререо записи (эквализация, добавление теневых каналов, задержек на базе головы-манекена) будет восприниматься у всех по-разному, что скажется на локализации и передачи звука в целом.
АЧХ динамиков наушников у каждой модели разная, а её также необходимо учитывать для программной обработки.
-
Для музыки скорее не подойдёт, будут искажения п.1. Но это не аксиома, возможно вы найдёте способ.
Так что, дерзайте ! Удачи.
amir_ad_dainl Автор
19.07.2023 15:43+1Вам тоже не хворать) Читал вашу статью ещё в начале своего пути, достаточно интересный проект. По поводу пункта 1: я хочу в будущем добавить в свой софт крутилки(или ввод данных) головы слушателя. Т.е. вводить расстояние между ушами, и т.д. и т.п.
Во всяком планируется большой список опроса информации, возможно проведу мини-исследование, для изучения акустической тени.(Как влияют волосы и т.д.) и наверное выложу по этому тоже статью.
По поводу второго... ну, ничего не бывает идеального, будем считать это проблемы пользователя))). У меня сейчас есть наушники, которых я благодоря измерительному оборудованию, эквалайзером смог выжить(+/-3 дб) что неплохо(думаю сами понимаете).
И по поводу третьего, пока-что объем есть, а искажений особых нет.По крайней мере, людям в слепом тесте больше нравился звук dsystem, нежели оригинала.
Из идей: хочу выложить проект на планета.ру (где хочу собрать денег на более крутые наушники, хорошую звуковую карту, и на второй измерительный микрофон). Так же потихоньку допиливаю софт. Большое спасибо за пожелания. Вам так же успехов!)
3DSound
19.07.2023 15:43И всё-таки рекомендую вам заложить в программу АЧХ наушников для вычисления разницы эквализации для тени и приведения к бинауралке. Графики можно взять с сайта лаборатории RAA (Reference audio analyser). Они сделаны на профессиональном оборудовании с бинауральной головы. То что вам нужно.
propell-ant
"Это всё было сделано практическими расчетами"
Если не секрет, что имеется в виду под практическими расчетами?
amir_ad_dainl Автор
Ну есть вводные данные, расстояние до АС, расстояние между АС, расстояние между ушами слушателя, угол расположение АС и т.д. и т.п. Получаются простейшие формулы из школьных курсов геометрии, там считается , получеется разница в скорости звука(0.0003 с в нашем случае) и всё. Ещё так же есть расчёт акустической тени, но я его подбирал экспериментальным путём (брал модель головы, и при условиях как в вычислениях получал АЧХ левого канала, и АЧХ правого, и получается их разность). всё гениальное просто!