Среди многочисленных комментариев к моей последней статье были два очень характерных вопроса — от группы людей, которых я условно могу отнести к категории “практиков”, и человека, который, возможно сам того не желая, озвучил позицию близкою многим аудиофилам.
Мне стало ясно, что далеко не всем понятны объяснения, основанные на теории спектрального разложения сигнала и дальнейшей манипуляцией с гармониками. Ниже я сделал попытку осветить отдельные вопросы из предыдущей статьи ещё более наглядно.
Итак, под катом рассмотрим две темы:
Почему цифровые фильтры в трактах обработки звука не всегда зло
Почему аналоговые фильтры высокого порядка сложно реализовать в серийных устройствах
Попробую раскрыть обе эти заслуживающие внимания темы как можно более доступным языком.
Почему цифровые фильтры в трактах обработки звука не всегда зло
Вопрос первый от FreeMind2000:
Просветите не специалиста? ;)
Первоначальная цепочка такая:
1) Живой звук -> АЦП(16бит, 44.1 КГц) -> CD
2) CD -> 16бит -> Микроконтроллер -> ЦАП(16бит, 44.1 КГц) -> восстановленный звук
После апгрейда:
2) CD -> 16бит -> Микроконтроллер + (Некий фильтр преобразующий 16бит в 18, 44.1 КГц в 44.1*4) -> ЦАП(18бит, 44.1*4 КГц) -> восстановленный звук
Т.е. в апгрейде мы всего лишь:
1. Поставили более дорогой ЦАП (с повышенной частотой дискретизации и разрядностью)
2. За счет придумывания(интерполирования) отсутствующих семплов на шкале времени CD — увеличили кол-во воспроизводимых семплов.
Верно?
Тогда, внимание, вопрос:
1. А действительно ли мы улучшили качество звука, добавив семплы, которые в оригинале (живом звуке) могли отличаться от тех, которые мы придумали(интерполировали)? Ведь, то что мы записали с частотой 44.1 КГц — было реально зафиксировано микрофоном, а то что было между записанными семплами нам не известно.
2. На сколько далеко наша фантазия (прошу прощения, интерполяция :) может нас завести? Т.е. теоретически, мы можем интерполировать и 8битный звук и 4х…
3. И о каком таком повышении качества мы говорим?
Для человека средний порог частоты воспринимаемого звука 20 кГц, мы воспроизводим с частотой 44.1 КГц — есть ли смысл в дальнейшем увеличении?.. Повышение точности воспроизведения на 2 разряда — единственное, что имеет отношение к реальному улучшению качества, хорошо, а кто-нибудь знает сколько разрядов может различать человеческое ухо? ;)
Да, теорема Найквиста верна, но если даже по двум точкам можно восстановить частоту периодического
Для того, чтобы проникнуть в суть проблемы необходимо понять следующее — совершив акт операции оцифровки мы тем самым невозвратно исказили сигнал. Даже если использовали идеальный микрофон, усилитель и аналого-цифровой преобразователь.
Давайте для наглядности перейдём от теории к практике и изобразим форму исходного сигнала на фоне сигнала, выходящего с идеального DAC.
Напомню, что DAC или
Посмотрим что же делает наша микросхема от SONY. Она в увеличила частоту сэмплирования в 4 раза. Мало того, она ещё и по вертикали добавила разрешения за счёт того, что увеличила разрядность сигнала с 16 до 18 бит. Далее, с помощью фильтра производится аппроксимация сигнала и вставляются три промежуточные точки, причём точность их установки выше как по горизонтали так и по вертикали в 4 раза, чем до сделанных преобразований. Аккуратной расстановкой этих точек занимается фильтр. Чем выше его порядок, тем качественнее он производит аппроксимацию.
Однако, после выполнения этих операций мы всё равно имеем ступенчатую структуру, не изображённую на рисунке — вместо них я изобразил жирные точки на трёх первых сэмплах. И тут уже в дело вступает простейший фильтр низкой частоты второго-третьего порядка, который сглаживает эти ступеньки. Результат показан ниже:
Здесь карандашная кривая — исходный сигнал.
Красная кривая — сигнал на выходе 16 битного ЦАПа.
Зелёный участок кривой — то что мы получили после операции ресемплинга и последующего применения простейшего фильтра.
Надеюсь, что FreeMind2000 и его сторонники согласятся, что “чистый неискажённый ступенчатый звук с выхода ЦАП” выглядит меньше похожим на оригинал, чем исковерканный цифровыми извращениями?
Замечу, что первое слева колебание имеет основную гармонику где-то в районе 44/7=6 килогерц, при этом на вид весьма сильно искажается при оцифровке с частотой 44 КГц. Представляете насколько будет похожим на оригинал сигнал с частотой в 17 килогерц?
Тут важно отметить то, что цифровые фильтры при желании могут не тронуть опорных точек полученных с 16 битного ЦАП — лишь расставить между ними вспомогательные, сглаживая кривую по своему усмотрению.
В силу ряда причин, это невозможно сделать применяя вместо цифры аналоговые фильтры высоких порядков. Тут кстати самое время перейти к вопросу
Почему аналоговые фильтры высокого порядка сложно реализовать в серийных устройствах
Tекст комментария AntonSor:
Для того, чтобы обрезать все, что лежит за границами звукового диапазона (20 кГц) и получить затухание под 40 дБ на 44 кГц, да с ровной фазовой характеристикой, требуется (с ровной — это фильтр Баттерворта) фильтр 7 порядка, это три операционных усилителя и по 10 5%-е резисторов и конденсаторов на канал. Да, громоздко, но не невозможно. Два счетверенных операционных усилителя типа TL074. В любительском приемнике прямого преобразования бывает больше (в фазовращателе).
Чтобы не заниматься все праздники ликбезом, я лишь вскользь упомяну, что качественные фильтры высокого порядка невозможно построить на операционных усилителях общего применения, к которым относятся TL074 от TI.
Совсем немаловажно, что аналоговые фильтры низкой частоты высоких порядков порождают серьёзные фазовые искажения, особенно в районе частоты среза. Доказывать эту общеизвестную истину чередой длинных формул нашим глубокоуважаемым товарищам я также не стану, лишь приведу картинку из одной моей прошлой статьи, которая показывает как жестого фазовые искажения обходятся с формой сигнала.
А в заключении
Для того, чтобы построить фильтр, приближающийся по этому параметру к цифровому, описанному в прошлой статье, необходим восьмой — десятый порядок.
Ниже показаны передаточная функция идеального ФНЧ и фильтров Баттерфорта разных порядков.
Каким образом обычно строятся подобные фильтры? Очень просто — берётся ФНЧ второго порядка построенный, например, по приведённой ниже схеме…
Отлично, давайте посмотрим на график, который показывает как меняются параметры фильтра Баттерворта второго порядка
А теперь представим себе суперпозицию передаточных характеристик нескольких таких звеньев с разными частотами среза, обусловленных разбросом компонентов.
Нетрудно догадаться, что мы не получим в результате эффекта повышения крутизны фильтра в зависимости от порядка. В дополнение мы породим лишние горбы на характеристике, которые станут причиной интермодуляционных искажений.
На самом деле ситуация ещё хуже потому, что разброс влияет не только на частоту среза, но и на другие параметры каждого из звеньев. Полученный в результате отфильтрованный звук
Вместо послесловия
Вместо послесловия публикую пару картинок от пользователя zerg59, который не поленился смоделировать
в ЛабВью аудиотракт с генератором сигнала, ацп, цапом и ресэмплером
Сигнал на выходе ЦАП с частотой 0.45 от частоты дискретизации. Хорошо просматриваются «нулевые биения»
Тот же сигнал, прошедший ресемплинг и цифровой фильтр десятого порядка
P.S. Не смог удержаться от использования в заголовке фрагмента рисунка из прекрасного комментария к первой части от пользователя Refridgerator
Комментарии (135)
zerg59
04.01.2017 05:05+1Ещё вспомнил, зачем вообще нужен это фильтр на выходе, если «человек усреднённый» выше 20 кГц не слышит:
Проблема в том, что нелинейные искажения в УНЧ растут с с ростом частоты. Достаточно посмотреть на зависимость коэффициента гармоник от частоты для многих УНЧ.
Так вот: берём мы 1 кГц. Оцифровываем, преобразуем обратно. Получаем наш 1 кГц и пары частот с разносом в 2 кГц. А вот тут приходит подлянка в виде интермодуляционных искажений: И мы получим разностную частоту в 2 кГц. А если это реальный сигнал? И вроде бы хороший УНЧ, который хорошо играл «тёплый ламповый» винил, начинает лажать на «нефильтрованной» цифре.melchermax
04.01.2017 09:49Видимо, поэтому Агеев сделал свой СЛ таким высокочастотным. А так, вообще, в большинстве усилителей стоит простейший RC фильтр (1 кОм и 100 пФ)
progchip666
04.01.2017 10:21+1Получаем наш 1 кГц и пары частот с разносом в 2 кГц.
Вот эта пара частот с разносом в 2 КГц и есть интермодуляционные искажения! Тот же сумматор в гетеродинных приёмниках ни что иное, как производитель интермодуляционных искажений.novice2001
04.01.2017 14:48Смеситель. И AFAIK идеальный смеситель должен сигналы перемножать, а не суммировать.
SADKO
04.01.2017 16:21С тёплым, ламповым винилом, тоже не всё так просто, там гораздо более агрессивный мастеринг чем в CD, так что пикфактор фильтры раздувают НО, это ещё цветочки по сравнению с пылинками на пластинке, от которых предусилитель\тон-корректор спроектированный по тупому, захлестнёт водопадом переходных процессов :-)
dernuss
04.01.2017 10:00Ну вот, я думал тут будет про устойчивость фильтра;)
Кстати говоря 1% резисторы вполне себе доступны)dernuss
04.01.2017 10:36Да и 1% конденсаторы вообщем тоже;)
progchip666
04.01.2017 10:43+1Да и 1% конденсаторы вообщем тоже;)
Это не так. Разве что керамика с диэлектриком NPO но они имеют малую ёмкость для звуковых ФНЧ, остальные технологически очень сложно сделать высокоточнымиdernuss
04.01.2017 10:49http://ru.mouser.com/ProductDetail/Kemet/C2220C474F5GACTU/?qs=Fn3VdHBzkcl72mr9SVJjcA%3d%3d
50volts 0.47uF 1%progchip666
04.01.2017 11:36+1Спасибо за ссылку, взял на заметку, а теперь посмотрите на его размеры и цену. А потом на ряд доступных номиналов.
Описанный в статье чип для ресемплинга стоит дешевле одного этого кондёра!
melchermax
04.01.2017 11:15+1Позвольте не согласиться: керамике, даже с NPO, в звуковом тракте делать нечего. Хорошая плёнка — наше всё.
progchip666
04.01.2017 11:33+1Согласен.
Но плёнку, особенно хорошую невозможно сделать тонкой просто из-за особенностей технологии изготовления.
Опять замкнутый круг.
progchip666
04.01.2017 10:41Кстати говоря 1% резисторы вполне себе доступны)
Сегодня они вполне доступны, это чистая правда. Но сравнительно просто их можно купить только из стандартного ряда. Теоретически экзотические номиналы можно собрать из двух или даже трёх включенных последовательно. Для фильтров нужны нестандартные. С конденсаторами дело обстоит гораздо хуже. Плюс те же конденсаторыкак и резисторы но в меньшей степенине идеальны. Но разбор этих неидеальностей — большая и интересная тема для отдельной статьи.dernuss
04.01.2017 10:51Большие фирмы вполне себе могут позволить изготовление компонентов на заказ.
zerg59
04.01.2017 15:12Можно вообще сделать керамическую подложку и нанести на неё практически какие угодно резисторы и потом ещё и лазером подогнать. И это доступно ещё с 70-х годов прошлого века точно. И керамика там не богопротивный сегнетоэлектрик, как в большинстве керамических конденсаторов, а вполне себе кошерный оксид алюминия например.
nerudo
04.01.2017 11:25+2Извините, но все эти размышления на пальцах «лучше-хуже» без спектрального анализа и примеров соответсвующих спектров совершенно бесплодны.
aamonster
04.01.2017 12:01+2Насчёт "Для того, чтобы обрезать все, что лежит за границами звукового диапазона (20 кГц) и получить затухание под 40 дБ на 44 кГц" — могли бы просто поправить товарища — мол, резать-то надо не до частоты оцифровки, а до половины частоты, а разница 20-22 — совсем не то же самое, порядок фильтра запредельный получается.
progchip666
04.01.2017 12:03Наш товарищ очень настойчив, к тому же не у него одного возникают подобные вопросы.
Refridgerator
04.01.2017 12:19Да, теорема Найквиста верна, но если даже по двум точкам можно восстановить частоту периодического сигнала
Я Найквиста не читал, но у Котельникова речь идёт именно о бесконечном сигнале. На практике, конечно же, в этом необходимости нет, поскольку необходимое количество точек ограничивает сама функция sinc — для 16-битного сигнала это 65536 точек, и даже оно является излишеством. А также шумы/искажения в исходном сигнале, в цапе (+ джиттер), в усилителе, акустике, комнате.zerg59
04.01.2017 15:29Вы не путаете квантование и дискретизацию?
Refridgerator
04.01.2017 18:01нет.
zerg59
04.01.2017 19:10И тогда каким образом 65536 уровней квантования напряжения (тока) 16-ти битного ЦАП связаны с дискретизацией сигнала (во времени), о которой идёт речь у Котельникова?
Refridgerator
04.01.2017 22:17Для понимания этого нужно вспомнить о том, как именно происходит восстановление сигнала, и что sinc(x) это sin(x)/x. Поделить на x. После того, как мы поделим квантованную амплитуду на значение, превышающее количество уровней квантования, полезного сигнала не останется. И это легко проверяется на практике.
zerg59
04.01.2017 19:25И ли вы о том, что для 16 бит оверсэмплинг более чем в 2^16 раз смысла не имеет? Но это совсем о другом. Хотя и здесь можно поиграться с дизерингом в духе 1битных ЦАПов ;-).
Бесконечный — это о времени. Вообще все понятия о спектре, преобразовании Фурье итд введены для бесконечных во времени сигналов. И это никак не связано с дискретизацией. Реальность тут вносит ещё один вид искажения: оконную функцию.
zerg59
04.01.2017 19:34Ещё один плюс оверсэмплинга: уменьшается влияние джиттера в выходном ЦАПе: ведь чем меньше изменяется сигнал между отсчётами — тем меньше искажений вносит джиттер.
artskep
04.01.2017 23:21У Котельникова (да и Найквиста и прочие названия) говориться об оцифровке:
1. Сигнала ограниченного по спектру (может быть вы это имели в виду под «бесконечностью», но тогда надо говорить о бесконечности во времени, т.к. сигнал конечный по спектру бесконечен по времени).
2. Отсчеты снимаются моментально.
3. Для восстановления сигнала нужен генератор дельта-функции и идеальный ФНЧ.
Все три условия физически не реализуемы. Чаще всего вспоминают про ограничение #3 (идеальный ФНЧ), но остальные тоже важны, если что. Но про них, видать, мало помнят после сдачи лаб/зачетов/экзаменов :-)progchip666
04.01.2017 23:24Хорошо, периодически повторяющийся и бесконечный во времени если вам угодно. реальный звуковой сигнал ни в коей мере не подходит под это определение.
VT100
04.01.2017 13:32+1При проектировании аналоговых фильтров — надо ещё учитывать желаемый коэффициет усиления каскадов фильтра (если оно нам нужно) и, при любом усилении, — требования к частотным свойствам ОУ. Что-бы не быть голословным — в недавнем home-made измерителе АЧХ (аналоговый осциллограф + DDS) понадобился фильтр для ШИМа, формирующего горизонтальную развёртку. При частоте среза двухкаскадного фильтра около 7 кГц и общем коэффициенте усиления 2.2 — калькулятор фильтров от Texas Instr. даёт требуемую полосу частот ОУ уже в 1 МГц.
А если применять switchet capacitor filter?
Опять проклятая цифра! ;-)progchip666
04.01.2017 18:34Опять проклятая цифра! ;-)
Вот тут уже даже я соглашусь без оговорок!
Кстати, а какой был DDS?
Много приходилось с ними работать, но сейчас стоит выбор между DDS и продвинутым ЦАПом. Пока не определился что лучше. DDS аппаратно выдаёт очень ограниченный спектр сигналов, а для ЦАП можно любой файл сформировать без особых проблем.VT100
05.01.2017 18:20Кстати, а какой был DDS?
AD9830. Не я его выбрал, а он меня (потому, что он был и был распаян на макетку). Если-бы железо было с нуля — взял-бы SPI-ный и посовременнее.
DDS аппаратно выдаёт очень ограниченный спектр сигналов
Задача была частная, настройка/восстановление нескольких радиоприёмников. Простого DDS'а — более чем достаточно.
P.S.Впрочем профессиональных спорщиков из этого форума никакой теорией не прошибёшь. Какие формулы не приводи, что не рисуй они просто слушают исключительно сами себя.
Не «этого», а «любого».
FreeMind2000
04.01.2017 17:24progchip666
Только вот увидел 2 часть статьи, спасибо за подробные ответы.
Но к сожалению, судя по резюме, вы видимо не до конца поняли смысл вопросов.
x-------x
Надеюсь, что FreeMind2000 и его сторонники согласятся, что “чистый неискажённый ступенчатый звук с выхода ЦАП” выглядит меньше похожим на оригинал, чем исковерканный цифровыми извращениями?
x-------x
На самом деле в ветке обсуждения https://geektimes.ru/post/284272/#comment_9792346, ставилось 3 вопроса и в принципе, на них удалось ответить благодаря комментариям:Refridgerator и vintage
При этом вывод оказался не утешительным… мировое правительство не дремлет :)
Но давайте все резюмируем в одном месте:
x-------x
1. А действительно ли мы улучшили качество звука, добавив семплы, которые в оригинале (живом звуке) могли отличаться от тех, которые мы придумали(интерполировали)? Ведь, то что мы записали с частотой 44.1 КГц — было реально зафиксировано микрофоном, а то что было между записанными семплами нам не известно.
x-------x
Ответ:
— По теореме Котельникова, если мы записали звук с необходимой минимальной частотой дискретизации, то можем сгенерировать промежуточные точки в любом количестве.
Значит, если запись велась с частотой дискретизации 44.1 КГц (а макс. воспринимаемая частота человеком 20КГц) — то этого вполне достаточно, чтобы в последствии восстановить промежуточные точки с любой точностью которая имеет смысл для человеческого уха. Качество восстановления (близость к оригиналу) определяется качеством фильтра используемого при интерполяции.
Здесь, я думаю все согласны.
x-------x
2. На сколько далеко наша фантазия (прошу прощения, интерполяция :) может нас завести? Т.е. теоретически, мы можем интерполировать и 8битный звук и 4х…
x-------x
Ответ:
— По той же теореме Котельникова, минимальная частота дискретизации при которой, возможно восстановление сигнала без искажений должна быть в 2 раза больше макс. частоты встречающейся в оригинальном сигнале.
Т.е. если берем макс. воспринимаемую частота человеком 20КГц, то минимальная частота для оцифровки = 40КГц
— По битности (т.е. разрядности шкалы амплитуды), можно сказать так: минимальная разрядность оцифрованного сигнала, должна в 2раза превышать разрядность (чувствительность) человеческого уха.
x-------x
3. И о каком таком повышении качества мы говорим?
Для человека средний порог частоты воспринимаемого звука 20 кГц, мы воспроизводим с частотой 44.1 КГц — есть ли смысл в дальнейшем увеличении?.. Повышение точности воспроизведения на 2 разряда — единственное, что имеет отношение к реальному улучшению качества, хорошо, а кто-нибудь знает сколько разрядов может различать человеческое ухо? ;)
x-------x
Ответ:
— Собственно, ответ на этот вопрос и является ключевым, ведь смысл как раз таки в том, зачем снижать погрешность и шумы, если их человек и так уже не чувствует?
Здесь ясность внес комментарий vintage
"
Тут утверждается, что дискретность уха в один момент времени не превышает 5 бит, а 16 с головой покрывает весь динамический диапазон уха: https://geektimes.ru/company/audiomania/blog/246304/
"
Очень интересная статья, всем рекомендую ознакомиться.
Я же в свою очередь из других источников нашел информацию, что повышение громкости (амплитуды) человек способен отличить при изменении исходной громкости на 10%, т.е. 1Дб. Если мы примем максимальным диапазоном амплитуды воспринимаемый человеком без боли 130Дб, то можно самостоятельно грубо посчитать разрядность (чувствительность) человеческого уха. Для этого просто надо взяв за исходную амплитуду 0.1 Дб посчитать сколько дискретных «точек» человек может распознать до 130Дб, с увеличением каждой следующей «точки» на 10%.
В итоге получилось 78 точек, что соответствует 7битам с большим запасом (50 точек). Т.е. вот при таком грубом расчете с запасом, мы приходим к выводу, что для оцифровки и воспроизведения звука без потери качества (с точки зрения человеческого уха) достаточно 7*2=14 бит для шкалы амплитуды.
Отсюда вывод:
"
Надеюсь, что FreeMind2000 и его сторонники согласятся, что “чистый неискажённый ступенчатый звук с выхода ЦАП” выглядит меньше похожим на оригинал, чем исковерканный цифровыми извращениями?
"
— С этим, я не спорил, и честно говоря к цифровым извращениям испытываю большую тягу чем к аналоговым :)
Суть в другом, вот что мы сделали:
1. Поставили более дорогой ЦАП (с повышенной частотой дискретизации и разрядностью)
2. За счет придумывания(интерполирования) отсутствующих семплов на шкале времени CD — увеличили кол-во воспроизводимых семплов.
Но зачем?
Ведь увеличение интерполированных точек, повышение частоты дискретизации и разрядности на ЦАП не влияет на качество звука ВОСПРИНИМАЕМОЕ ЧЕЛОВЕКОМ, ибо ЦАП(16бит, 44.1 КГц) достаточно и даже с большим запасом.
Получается все эти «улучшения качества» с точки зрения человека воспроизводящего звук с CD — не более чем маркетинговый трюк…novice2001
04.01.2017 18:53+1Человек написал 2 статьи, объяснил, разжевал — и опять те же вопросы…
Суть увеличения частоты дискретизации — замена дорогого, сложного, крупногабаритного аналогового ФНЧ высоких порядков (да еще с плохой ФЧХ) на связку простого и дешевого цифрового + простого и дешевого аналогового низкого порядка. Вот и все.
И улучшение качества в данном случае — это не улучшение исходного звука, это улучшение приближения звука на выходе системы к исходному.FreeMind2000
04.01.2017 22:12+1Я писал о том, что:
1. Замена существующего оборудования имеющего ЦАП(16бит, 44.1 КГц) на оборудование с ЦАП имеющем повышенною частоту дискретизации и разрядности — не имеет смысла, так как разницы человек не услышит.
2. И так же думаю, что
замена РАБОТАЮЩЕГО дорогого, сложного, крупногабаритного аналогового ФНЧ высоких порядков (да еще с плохой ФЧХ) на связку простого и дешевого цифрового + простого и дешевого аналогового низкого порядка — не имеет смысла, если все паразитные шумы лежат за пределами человеческого уха.
Вот и всё :)
«И улучшение качества в данном случае — это не улучшение исходного звука, это улучшение приближения звука на выходе системы к исходному.»
— Поймите, в этом приближении нет смысла, если человек разницы почувствовать не может.
На графиках, всегда рисуют оцифрованный звук большими некрасивыми ступеньками, даже автор данной статьи прибегает к этому приему ;-)
Причем, после добавления промежуточных точек, график якобы становится «красивее» и ближе к оригинальному сигналу. Но, если мы увеличим масштаб раз в 10, то произойдет чудо… через те же самые дополнительные точки, которые красиво приближались к исходному сигналу, опять будут проходить большие некрасивые ступеньки, очень далекие от оригинального сигнала… И такое приближение можно делать до бесконечности опять добавляя промежуточных точек… Но зачем???
Смысл в том, что имея CD-проигрыватель с ЦАП(16бит, 44.1 КГц) человек смотрит на ступеньки с такого далекого расстояния и запасом, что ни одной мало мальски некрасивой ступеньки выступающей от оригинального сигнала увидеть не сможет при всем желании.
Я могу привести аналогию с TV. Сейчас становится модным формат 4K — и это хорошо, отличие от FullHD на глаз мало, но ЗАМЕТНО. Т.е. в 4К человек четко может сказать, что картинка лучше. Это всё почему?, потому, что по оценкам разных специалистов разрешение человеческого зрения около 50К — 100К. Так вот, когда появится телевизор с разрешением 200К, то тогда можно сказать, что это равносильно тому, что сейчас используется при воспроизведении с CD-проигрывателя с ЦАП(16бит, 44.1 КГц).
Те кто считает, что сравнивать разрядность/дискретизацию звука АЦП/ЦАП и чувствительностью человеческого уха нельзя, равно как разрешение для человеческого глаза — в общем смысле ошибаются. Да, напрямую нельзя, т.к. у человеческих органов есть своя специфика и не линейность чувствительности в разных зонах. Но грубо/приблизительно, привести к общему знаменателю и сравнить можно, а когда при сравнении мы видим более чем двух кратное превосходство, то можно уже делать выводы.
novice2001
05.01.2017 00:15Простите, а где автор пишет о замене работающих аналоговых фильтров?
Подозреваю, что аппаратура с такими фильтрами находится либо в чуланах, либо у самых упоротых пользователей.
Сейчас подавляющее большинство (99 и не знаю сколько еще девяток после запятой %) делается именно так, как описано в статье. Хотя бы потому что это проще, лучше, стабильнее и дешевле.
Исторический экскурс так сказать.FreeMind2000
05.01.2017 14:30Автор не пишет. То, что их нет смысла менять, это как раз мое мнение, подкрепленное после небольшого погружения в суть передискретизации и улучшения качества звука, о которых идет речь в статье.
novice2001
05.01.2017 16:14Их есть смысл менять хотя бы с точки зрения доступности аппаратуры и стабильности ее характеристик.
Параметры цифрового фильтра абсолютно стабильны, он не нуждается в настройке, крайне дешев.
Параметры аналогового фильтра в системе с цифровым некритичны, он прост, и дешев.
В системе с аналоговым фильтром высоких порядков фильтр дорог, его параметры меняются в зависимости от температуры и со временем.
Так что даже если при выходе с производства обе системы будут иметь сравнимое качество звука (что уже объективно невозможно в связи с плохой ФЧХ полностью аналоговой системы), то со временем аналоговая будет звучать только хуже.
Какой смысл сохранять значительно более дорогую, объемную, тяжелую и нестабильную систему кроме «ятакхочу»?FreeMind2000
05.01.2017 23:48Я уже писал об этом несколько раз.
Смысл в том, что если дорогая старая техника работает и претензий у пользователя к качеству звука нет, то поддаваться на маркетинговые уловки и выкидывать деньги на ветер не надо. На новой технике услышать «лучший» звук не получится.
Поймите, все эти «доступность аппаратуры», «стабильность характеристик», «ФЧХ»… всё это пыль, если итоговое качество звука СЛЫШИМОГО человеком — его устраивает. Если от температуры или от времени, параметры фильтра меняются, но я этого не могу услышать, то для меня они роли не играют. Если же старая аппаратура работает плохо и постоянно приходится ее перенастраивать, чтобы бороться с шумами и помехами, то конечно ее надо менять, с этим никто не спорит.novice2001
06.01.2017 12:53Да сколько уже можно?
Где, в каком именно предложении автор предлагает хоть кому-то менять свой старый хлам, который его устраивает, на что-то новое??? Если кого-то устраивает патефон, то никаких проблем.
Это не маркетинговые уловки. Это всего лишь описание того как менялась техника. Было так-то, стало так-то. произошло это вот поэтому и вот поэтому. Все. ТОЧКА.FreeMind2000
06.01.2017 13:33+1Знаете, у вас происходит либо кратковременное отключение памяти, либо вам просто нравится задавать один и тот же вопрос по 1000 раз… https://geektimes.ru/post/284300/#comment_9795036
Давайте на этом уже закончим.novice2001
06.01.2017 14:02-1С памятью у меня все хорошо.
Это у вас некоторые проблемы с пониманием написанного. В частности, с понятием контекста.
Там где я писал «Их есть смысл менять» речь шла о производстве, а не в старых патефонах, устраивающих своих владельцев.
Как собственно и произошло.
zerg59
04.01.2017 19:48+1Для этого просто надо взяв за исходную амплитуду 0.1 Дб посчитать сколько дискретных «точек» человек может распознать до 130Дб, с увеличением каждой следующей «точки» на 10%.
В итоге получилось 78 точек, что соответствует 7битам с большим запасом (50 точек). Т.е. вот при таком грубом расчете с запасом, мы приходим к выводу, что для оцифровки и воспроизведения звука без потери качества (с точки зрения человеческого уха) достаточно 7*2=14 бит для шкалы амплитуды.
Это всего лишь означает, что для плавной (т.е когда человек не различает ступеньки) регулировки громкости достаточно 14 бит. Какое это имеет отношение к квантованию собственно сигнала?
а кто-нибудь знает сколько разрядов может различать человеческое ухо? ;)
Ухо вообще по другому работает. Там термин «разрядность» неприменим.
FreeMind2000
05.01.2017 00:07«Какое это имеет отношение к квантованию собственно сигнала?»
— Я исходил из того, что возможность услышать звук, зависит от его амплитуды. Самый тихий звук который мы можем услышать, характеризуется минимальной амплитудой (которою может чувствовать ухо), и соответственно самый громкий звук — максимальной амплитудой. Отсюда, мы можем определить мин. и макс. амплитуду которую может воспринимать человек, ну и соответственно, зная шаг изменения громкости, можно определить кол-во разрядов на шкале амплитуды для человека. Конечно, это грубо, и эта так сказать моя собственная оценка, если вы хотите более точного определения, можете обратиться к статье приведенной в комментарии выше.
«Ухо вообще по другому работает. Там термин «разрядность» неприменим.»
— На это я тоже ответил чуть выше.
zerg59
04.01.2017 20:08+2Ещё: "Наиболее неприятные на слух искажения, вносимые на этапе оцифровки — гранулярный
шум, возникающий при квантовании сигнала по уровню из-за округления амплитуды до ближайшего дискретного значения. Гранулярный шум сильно связан с
сигналом (зависит от него), и представляет собой гармоники сигнала, искажения от которых наиболее заметны в верхней части спектра. Проявления гранулярного
шума и его связь с сигналом легко заметить, прослушав синусоидальный сигнал с частотой около 0.1..5 Гц — гранулярный шум в этом случае проявляется в виде
изменяющегося по высоте паразитного тона, частота которого зависит от частоты, формы и максимальной амплитуды полезного сигнала.
Мощность гранулярного шума обратно пропорциональна количеству ступеней квантования, однако из-за логарифмической характеристики слуха при линейном квантовании (постоянная величина ступени) на тихие звуки приходится меньше ступеней квантования, чем на громкие, и в результате основная плотность нелинейных искажений
приходится на область тихих звуков. Это приводит к ограничению динамического диапазона, который в идеале (без учета гармонических искажений) был бы равен
соотношению сигнал/шум, однако, необходимость ограничения этих искажений снижает динамический диапазон для 16-разрядного кодирования до 50-60 дБ."
Не все шумы и искажения, равные по амплитудному (процентному) соотношению будут равны по восприятию человеческим ухом. Почитайте статью. Учитывая дешевизну реализации ЦАПов с высокой разрядноситью, проще и дешевле просто свести уровень искажений, связанных с квантованием, до пренебрежимо малых величин и не мучаться. Нет никакого заговора. Это просто самое простое и эффективное решение проблемы с шумом квантования/гранулярным шумом на данный момент.
sh0k
04.01.2017 17:44Вы (автор),
как всегдаправильно написали фразу «для периодического».
Сложность заключается в том, что музыка — этосовсемне всегда периодический процесс.
Посему и любая попытка интерполяции улучшает объективные параметры и ухудшает собственно воспроизведение музыки.progchip666
04.01.2017 17:56Это уже не лечится.
Специально для людей, с такой точкой зрения написал целую статью где всё уже разжованно с картинками для уровня восприятия дошкольника.
Любая оцифровка коверкает звук.
Оцифрованный звук — это близко не исходный звук и хорошая интепорляция его только улучшает.
Без интеполяции запись с битрейтом CD вообще слушать невозможно.
Посему и любая попытка интерполяции улучшает объективные параметры и ухудшает собственно воспроизведение музыки.
Подобная точка может существовать, но если сказали А, надо говорить уже и B.
Слушать музыку необходимо только вживую, причём музыканты не должны пользоваться усилительной аппаратурой.progchip666
04.01.2017 18:39Если честно, то на «живых» концертах зачастую качество музыки бывает таким, что лучше с айфона MP3 слушать!
Аналоговая запись тоже не обходится без искажений.
На магнитную ленту пишут с подмагничиванием, что приближает запись к цифре, ну а для записи на винил сигнал предварительно серьёзным образом искажают и компрессируют.
Прослушивание же живых артистов в специальной студии не каждый миллиардер себе позволить может.
sh0k
04.01.2017 19:08Оцифрованный звук — это близко не исходный звук
В данном случае, некорректное утверждение. Дискретизация (этот термин уместнее — видите, переходим на исходный английский и становится проще?) — это всего лишь способ зафиксировать процесс. Как его восстановить из записи — вот вопрос.
хорошая интепорляция его только улучшает.
Еще можно сравнить с кино, 24 кадра в секунду типо достаточно для глаза, хотя на движущихся картинках нечеткость и смазанность очевидна. Когда появились достаточно доступные видеопроекторы бОльшего разрешения, чем 640х480, тоже стало очевидным, что из стандарта DVD бОльшее количество пикселей получить сложно. Точнее, интерполировать-то никаких проблем, картинка выходила гладкая, но, бестолковая — очевидно, деталей на ней не прибавлялось — потому как неоткуда им было взяться.novice2001
04.01.2017 19:13Сравнить с кино нельзя, вы так и не поняли сути написанного. В данном случае интерполяция не предназначена для увеличения «детальности» звука, она предназначена именно для более достоверного его воспроизведения более простыми средствами.
sh0k
04.01.2017 19:28Это Вы как раз перепутали апсэмплинг с оверсэмплингом.
Тупое добавление нулей ничего не делает сисходником, а вот интерполяция — делает.novice2001
04.01.2017 20:42+1Нет, это вы перепутали апскейлинг (в ТВ) с апсэмплингом.
Да, есть интерполяция, которая искажает цифровой исходник с CD. Но нам, вообще говоря, абсолютно безразлично какие именно цифровые преобразования претерпевает сигнал. Нам важно, чтобы окончательный аналоговый сигнал на выходе усилителя как можно точнее повторял сигнал до оцифровки. Апсэмплинг не пытается добавлять никаких аналоговых «деталей» (в отличие от апскейлинга видеосигнала), его цель именно максимально приблизить форму выходного аналогового сигнала (после DAC и фильтров) ко входному (до ADC). Поскольку суммарная АЧХ цифрового и аналогового фильтров такова, что частоты, проходящие через него не превышают 44,1 кГц пополам, то никаких аналоговых «деталей» к звуку добавиться не может. Он делает то же самое, что и аналоговый фильтр без апсэмплинга, но дешевле, компактнее и без лишних фазовых искажений.
SADKO
05.01.2017 14:17Сравнить с кино как раз возможно и это даже забавно:
"24 кадра в секунду типо достаточно" для создания иллюзии непрерывного движения да, но мерцание с частотой 24Hz вы себе представляете? Это-же жесть, заметная даже упоротому транквилизаторами мозгу.
По этому в кино проекционном аппарате есть такая хренька — обтюратор, с двумя или тремя лепестками, которая во время экспозиции кадра, перекрывает световой поток, умножая частоту мерцания на 2 или 3!
В таком виде, кино смотреть в разы приятней, ибо частота мерцания оказывается за гранью восприятия.
PS.А что-бы не было смазывания, в киносъёмочном аппарате так-же был обтюратор, но более хитрый, сменный или настраиваемый, дабы сократить время экспозиции, ибо 1\24 секунды, это как бы дофига.novice2001
05.01.2017 16:04Сравнивать с кино нельзя. Обтюратор не имеет отношения ни к интерполяции ни к фильтрации. Аналогии должны быть уместными.
SADKO
05.01.2017 16:37Он имеет отношение к умножению частоты! А интерполяцией дискретных значений освещённости занимается зрительный анализатор, в итоге получается фильтр…
Но вы правы, приводить пример из области оперирующей пространственными частотами, там где люди с одномерным рядом разобраться не могут, действительно не уместно…novice2001
05.01.2017 17:13К увеличению частоты мерцания. При этом информация содержащаяся в каждом кадре не умножается, и вообще никак не изменяется. В отличие от ресэмплинга. Поэтому аналогия неуместная.
sh0k
11.01.2017 12:13обтюратор, с двумя или тремя лепестками, которая во время экспозиции кадра, перекрывает световой поток, умножая частоту мерцания на 2 или 3!
В таком виде, кино смотреть в разы приятней, ибо частота мерцания оказывается за гранью восприятия.
Спасибо, именно эта аналогия ближе всего к процессу добавления нулей.
sh0k
04.01.2017 19:25Без интеполяции запись с битрейтом CD вообще слушать невозможно
Вроде только то рассказали, что выходной фильтр нужен для того, чтоб не мучать усилитель ужосами, а не для того, чтоб уху лучше было.
Без фильтра и передискретизации в первую очередь страдает ВЧ область. Да, мы привыкли к перидискретизированному звуку, к «хрустальному», «воздушному» и т.д. Но это всего лишь звуковые эффекты, ненужные для восприятия музыки. Тот же стандарт LP был не очень-то и богат на ВЧ, а конусные ВЧ-динамики почти не воспроизводили выше 15-16кГц. Да и выходные трансформаторы не очень-то высоко играли. Так что просто мы привыкли за последние 20-30 лет к звону «высоких», а другого ХОРОШЕГО звука в СССР было почти и некому услышать.
Подытоживая — без передискретизации вполне даже слушабельно, если не искать звуковых спецэффектов.
Другое дело, что обычная аппаратура (кремниевый усилитель с ООС) будет работать с выходом ЦАПа без фильтра откровенно плохо.zerg59
04.01.2017 20:48+2Наверно да. Если подключить ЦАП к ламповому усилителю, который нагружен на акустику с потолком в 16 кГц — то можно обойтись.
А если аудиотракт типа этого, и слушается всё через мониторные наушники: «Швейцарская компания Nagra выпустила в продажу цифро-аналоговый преобразователь Classic DAC. Новинка представляет собой более доступную версию модели HD DAC и отличается от неё отсутствием регулятора громкости и усилителя для наушников, а также несколько изменённой аналоговой секцией. В последней используется по 9 тщательно подобранных транзисторов на канал, а отношение сигнал/шум (невзвешенное) выходного каскада достигает 145 дБ,» — то придётся и ЦАП ставить соответствующий. Другое дело, что рядовому гражданину для прослушивания русскава рэпа это не нужно.
Это же как прон в 4К. Не каждый найдёт удовольствие в разглядывании прыщиков на теле актрис и качестве бритья ;-). То ли дело VHS и кинескопный телек.
ptica_filin
04.01.2017 21:55выходной фильтр нужен для того, чтоб не мучать усилитель ужосами, а не для того, чтоб уху лучше было.
Если мучить ужосами усилитель, то хуже станет не только ему, но и уху. Даже если эти ужосы на ультразвуковых частотах. Если хорошенько перегрузим усилитель ультразвуковым сигналом, то получившиеся интермоды залезут в слышимый диапазон и испортят не только ВЧ, но и СЧ, а то и НЧ, если повезёт.
evtomax
04.01.2017 18:44В аудиоплеерах часто есть кнопочка, которая позволяет зациклить любую музыку. И вообще практика говорит, что теорема прекрасно применяется на практике: https://geektimes.ru/post/246728/
progchip666
04.01.2017 23:32С одной оговоркой. Трудно найти компьютер, который не развалится от времени, пока будет обсчитывать восстановление музыкального фрагмента в несколько минут целиком. Если этот процесс вообще завершится до конца существования вселенной.
zerg59
04.01.2017 20:17Ещё в пользу повышения разрядности. Давайте отвлечёмся от нашего синуса на 20 кГц и перейдём к реальной музыке.
Итак:Звучащий симфонический оркестр обладает динамическим диапазоном свыше 90дБ
Пусть мы используем весь динамический диапазон нашего 16 бит ЦАП. Тогда самый тихий звук оркестра будет -90 дБ от размаха. На него останется 6 дБ динамического диапазона а это...1 бит! Дада. самый тихий (но различимый) звук будет воспроизведён меандром ;-) А учитывая, что в симфонической музыке есть как громкие места так и тихие, то в тихих местах этот меандр будет прекрасно слышен. Ибо его просто нечему будет маскировать.evtomax
04.01.2017 20:39Вот только придётся задрать громкость усилителя, чтобы искажения не замаскировались окружающим шумом. Но даже для любителей крутить ручки усилителя придумали хитрое подмешивание шума.
zerg59
04.01.2017 20:55+1хитрое подмешивание шума.
А сейчас, в силу дешевизны, используют лобовое решение: 24бит/192 кГц (или выше). И проблема с дискретизацией/квантованием уходит на дальний план и можно сосредоточиться на качественной аналоговой части типа 9 транзисторов и с/ш 145 дБ ;-)progchip666
04.01.2017 21:12В случае 24 битного сигнала такой частоты оцифровки скорее всего будет достаточно простейшего фильтра. Но речь в статье идёт о том, как с приемлимым качеством можно слушать обычные CD
progchip666
04.01.2017 21:10Посмотрите на картинки. На выходе ЦАП не меандр
сколько же можно это повторять!!!!а прямоугольные ступеньки!
Именно для того чтобы сгладить форму этих ступенек и используется передискретизация!!!zerg59
04.01.2017 21:41Если исходный цифровой сигнал меняется периодически только в младшем значащем разряде — то меандр ;-). Ну если отцентровать — то да — что-то типа имитации синуса на самом дешёвом бесперебойнике. Лучше от этого не станет.
Речь то идёт о том, что надо воспроизводить не просто синус большой амплитуды. А реальный сигнал с динамическим диапазоном, практически перекрывающим динамический диапазон 16-битного ЦАП.
zerg59
04.01.2017 22:04+1Как-то так будет выглядеть сумма очень тихих чистых тонов Местами вполне менандр ;-)
zerg59
04.01.2017 23:02+2Хотите увидеть ступенчатые сигналы?
Итак: частота равна 1/10 от частоты дискретизации. Разрешение 16 бит. Идеальных, ибо кирпичик labView
А вот те же условия, но частота сигнала 0,5 от частоты дискретизации.
Меандр однако. При любой разрядности будет меандр :-)
dernuss
04.01.2017 21:53В статье человек делал фильтр Бесселя 10го порядка
http://service4u.narod.ru/html/filter.htmlzerg59
04.01.2017 22:12+1Я охотно верю, что можно сделать. Только это нужно на данном этапе примерно как троллейбус из буханки хлеба. Разве что маркетологи если раскрутят в узких кругах любителей первых «параллельных» (а скорее всего R-2R) ЦАПов ;-)
zerg59
04.01.2017 22:29Ещё аргумент: берём входной сигнал не 1 кГц а 20кГц. Так вот — без фильтрации при частоте дискретизации 44.1 у него образуется брат-близнец на частоте 24,1 с равной амплитудой. И спокойно пройдет через фильтр Бесселя 10го порядка. Ибо относительная разница в частотах равна 1,2. А фильтры Чебышева и Баттерворта по вполне логичным мотивам автором указанной вами статьи были были забракованы.
dernuss
04.01.2017 22:33+1Да я вообще за цифру и за 24 бита @ 192 КГц;)
Вот только я не слышу выше ~18 КГц((zerg59
04.01.2017 22:57Зато при плохом раскладе прекрасно услышите 24,1-20=4,1 кГц. Причём ухо его быстро отловит как чужеродный тон.
aamonster
04.01.2017 23:12+1А "плохой расклад" в данном случае — наличие хотя бы небольшой нелинейности в тракте?
zerg59
04.01.2017 23:14Да. И на высоких частотах нелинейность тракта обычно растёт.
aamonster
05.01.2017 01:08Ограниченная скорость нарастания выходного напряжения? (Я не настоящий сварщик, так что вопросы, наверное, детские)
zerg59
05.01.2017 14:02Одна из основных причин — уменьшение глубины отрицательной обратной связи.
Далее — просто сама схемотехника (разводка, выбор элементов) может быть не адекватна для нормальной работы с высокими частотами, ибо делалась под ЗЧ.
А если УЗЧ класса D. То там вообще могут повылезти комбинационные частоты частоты дискретизации и частоты ШИМ.
zerg59
04.01.2017 23:13Иллюстрация «биений» при частоте сигнала 0,49 от частоты дискретизации:
Можно воспринимать как результат интерференции частоты тона и её «зеркальной» частоты. А можно понять как своего рода «стробоскопический» эффект.
Можно воспроизвести, нарисовав синус и делая дискретизацию руками и карандашём ;-)
dernuss
04.01.2017 23:16Не переживайте, я не буду собирать фильтр Бесселя;)
zerg59
04.01.2017 23:44+1Я не переживаю. Я накидал в ЛабВью аудиотракт с
блэкджеком…с генератором сигнала, ацп, цапом и ресэмплером и теперь радуюсь. Вы просто вопросы задаёте подходящие ;-)
Итак. Маленькое чудо:
Что мы имеем изначально. Сигнал с частотой 0,45 от частоты дискретизации:
А теперь делаем ресэмплинг 10х и фильтрацию
Никаких биений! Кстати — если просто соединять точки сплайнами а потом ресемплировать — то биения не уйдут.progchip666
05.01.2017 11:45Спасибо. Отличный пример! Надеюсь автор не будет против если я добавлю его в мою статью?
SADKO
05.01.2017 13:05и ИМХО стоит добавить физико\математический ликбез, ибо для многих не разу не очевидны преобразования частоты, отсюда и дебильные вопросы.
progchip666
05.01.2017 15:16Скорее уже математический, но это задача скорее для zerg59, пока не закончились праздники он мог бы написать замечательную статью по этому поводу.
Я всё таки больше по области hardware чем математики.
Впрочем профессиональных спорщиков из этого форума никакой теорией не прошибёшь. Какие формулы не приводи, что не рисуй они просто слушают исключительно сами себя.
aleksey001
04.01.2017 23:35-3я не согласен с тем что мастеринг делается на 16х44 щас даже самая нищая домашняя студия мастерит на 24х192. также я не согласен с тем что можно достоверно передать частоту 20кгц дискретизацией 44кгц. можете проверить взять песнь какогонибудь тенора пожать её семпл до 2кгц потом обратно растянуть до 44 и послушать. реально при прослушивании СД все что выше 8кгц давольно лживо звучит, а выше 16 скорее шум. слаа богу есть формат 24х192 к которому у меня нет притензий в плане достоверности ВЧ.
progchip666
04.01.2017 23:36А разве кто нибудь спорит?
Но ещё очень многие слушают СD, и подавляющее количество звуковых карт даже в персональных компьютерах до сих пор 16 битные!
novice2001
05.01.2017 00:25+2также я не согласен с тем что можно достоверно передать частоту 20кгц дискретизацией 44кгц
Также вы можете не соглашаться с тем, что Земля сферическая и обращается вокруг Солнца. Однако это никак не мешает именно Солнцу быть центром масс Солнечной системы.
взять песнь какогонибудь тенора пожать её семпл до 2кгц потом обратно растянуть до 44 и послушать
Хороший метод, Одобряю.Взять самолет, переехать бульдозером, а потом заявить «аппараты тяжелее воздуха летать не могут».
zerg59
05.01.2017 01:40+1также я не согласен с тем что можно достоверно передать частоту 20кгц дискретизацией 44кгц.
20/44=0.4545 Пример восстановления с картинкой в сообщении выше.
evtomax
05.01.2017 01:41+1А я вот взял и проверил, как 44100 жутко корёжит выше 8 кГц: https://geektimes.ru/post/246728/
Вы тоже можете проверить :-)Refridgerator
05.01.2017 12:08Так у вас некорректно сравнение сделано.
evtomax
05.01.2017 15:22Взял исходник 192 кГц, удалил фильтром частоты выше 20 кГц, сконвертировал в 44100 и обратно в 192000. Вычел результат с двойным ресемплингом из исходника с фильтром, и получил разницу. Где ошибка?
SADKO
05.01.2017 17:11В исходнике, который по всей видимости ничего выше 20 кГц и не содержал…
Возьмите какую-нибудь библиотечную литавру или сами оцифруйте гитару со стальными струнами, и будет результат.evtomax
05.01.2017 21:26+1А скриншот программы со спектром я для кого делал?
Я статью давно писал, но до сих пор никто не привёл пример аудиозаписи, в которой после таких манипуляций что-то портится до 20 кГц.
Refridgerator
05.01.2017 19:03Ошибка в постановке задачи, что вы делаете, как вы это делаете, и в интерпретации результатов.
Если задача показать, что для 20кГц не нужно 192кГц — так это Котельников/Шеннон/Найквист давно доказали.
Если задача показать, что человек не слышит выше 20 кГц — так это надо фокус-группу собирать и двойное слепое прослушивание устраивать.
Если задача показать, что в HD-записях нет частот выше 20 кГц — так их фильтровать не надо и собрать достаточное количество записей для репрезентативного анализа.
Если задача показать несовершенство алгоритма передискретизации в конкретно взятом аудио-редакторе — так надо его импульсную характеристику анализировать, а не какую-то конкретную аудиозапись.evtomax
05.01.2017 21:19-1Котельников/Шеннон/Найквист давно доказали только математикам и людям, доверяющим науке. Для других людей совсем не очевидно, что 44100 достаточно, чтобы не терялась информация о высоких частотах. Цитирую комментарий, на который я изначально отвечал: «я не согласен с тем что можно достоверно передать частоту 20кгц дискретизацией 44кгц».
Refridgerator
05.01.2017 22:57Люди, не доверяющие Котельникову, даже не пытались почитать его работу. Иначе очень быстро бы выяснилось, что их недоверие вступает в конфликт с объективной реальностью, в которой имеет место быть теле- и радио-вещание.
progchip666
06.01.2017 18:08щас даже самая нищая домашняя студия мастерит на 24х192.
тут такая же история как и с мегапикселями в мылницах и 700 Ваттах звука в аудиоцентре за 10 тыс деревянных.
На китайской коробке могут быть написаны любые цифры, там даже изредка могут стоять приличные микросхемы, но при этом одной только «грамотной» трассировкой можно так испортить звукне говоря уже о питании, дискретных компонентах и звенящих фильтрах, что 16 битный CD будет много более качественный сигнал выдавать.
vintage
05.01.2017 01:59Пока санитары не смотрят, позволю себе напомить:
1. Задача ЦАП выдать не оригинальный сигнал, а сигнал неотличимый от оригинального на слух.
2. Человеческое ухо — АЦП с частотой дискретизиции в 20 КГц и точностью дискретизации в 5 бит.
SADKO
05.01.2017 12:51-1Отсыпь травы брат :-)
Если уж сравнивать, что человеческое ухо, это преобразователь импеданса, с АРУ и нелинейностями, и до фига полосный анализатор спектра, причём каждая полоса охвачена АРУ, срабатывание которого порождает импульс в соответствующем канале, далее уже мозг, но там всё ещё веселей…
… и да, мы знаем об этом достаточно много, что бы кодировать звук для кохлеарных имплантатов, или создавать иллюзию баса в наушниках, или чистый-прозрачный звук в мутной трансляционной сети, это всё психоаккустика называется
zerg59
05.01.2017 13:22Человеческое ухо — АЦП с частотой дискретизиции в 20 КГц и точностью дискретизации в 5 бит.
Ознакомьтесь, пожалуйста, с литературой (в гуголе легко находится электронный вариант):
Цвикер Э., Фельдкеллер Р. Ухо как приемник информацииvintage
05.01.2017 13:46Извините, не не ознакомлюсь. У меня есть дела по интереснее, чем читать 7 мегабайт текста только для того, чтобы возможно понять в чём заключается ваше возражение.
zerg59
05.01.2017 14:05+2У меня есть дела по интереснее
У меня тоже есть дела по интереснее, чем разжёвывать лентяям основы психоакустики ;-). Идите с миром… ;-)vintage
05.01.2017 14:15-2Имейте ввиду, что позиция «вы не догадаетесь, с чем я несогласен, пока не прочитаете вон тот талмуд» не делает вас умнее в глазах окружающих.
pehat
05.01.2017 14:48Ежу понятно — с 5 битами.
vintage
06.01.2017 09:56У вас другие данные?
pehat
06.01.2017 13:47Возьмите любой звуковой редактор, который умеет преобразовывать квантизацию к 5 битам и проверьте своими ушами.
vintage
06.01.2017 15:24Вот возьмите и проверьте, только имейте ввиду эффект маскировки, не позволяющий нам единовременно воспринимать весь доступный нам динамический диапазон громкостей.
ZEvS_Cat
07.01.2017 17:22При 5 битах, динамический диапазон был бы около 30 дБ. Вы заявляете, что динам. диапазон человеческого слуха 30 дБ?
vintage
07.01.2017 21:56Нет, я такого не говорил.
Динамический диапазон уха (если не брать в расчёт разные степени болевых ощущений) — порядка 12 Б или 20 бит.
При этом громкость выше 10 Б никто в здравом уме выкручивать не будет. Уровня шумов ниже 3 Б добиться весьма не просто. Так что для записей остаётся лишь 7 Б, что чуть больше 10 бит.
Тем не менее при мастеринге звук всё равно компрессируют максимум в 4 Б, что чуть больше чем 6 бит. Но как правило жмут ещё сильнее, вплоть до 0,4 Б (ага, меньше бита на отсчёт).
Это всё, чтобы понимать масштаб трагедии — 90% населению планеты более чем достаточно 6 бит на отсчёт.
Почему? Да потому, что из-за эффекта маскировки звуки на 3 Б (или в 8 раз) тише от самого громкого в критической полосе уже не слышны. Для примера, можете попробовать, прошептать что-нибудь активно разговаривающим собеседникам находясь в метре от них. Услышат ли они вас?ZEvS_Cat
07.01.2017 23:51Простите, а что это за такая единица измерения «Б»?
vintage
08.01.2017 00:29https://ru.wikipedia.org/wiki/Бел
ZEvS_Cat
08.01.2017 03:34Ок, хотя я привык к дБ, а вообще речь наверное про дБА, ну да бог с Вами.
2. Человеческое ухо — АЦП с частотой дискретизиции в 20 КГц...
Возможно Вы хотели написать 40 КГц? А иначе люди бы не слышали звуки выше 10 КГц.
… и точностью дискретизации в 5 бит.
Это «работает» только для однотонального сигнала (в отсутствии других звуков или шумов).
Могу объяснить почему.
vintage
08.01.2017 09:06Теорема котельникова тут не работает, так как ухо фиксирует мгновенное ачх и восстановлением исходного сигнала не занимается.
Оно для любых сигналов работает, на чём и о основано сжатие с потерями. Или у вас другие данные?
progchip666
05.01.2017 12:29и точностью дискретизации в 5 бит.
Откуда у вас такая информация?vintage
06.01.2017 10:22+1Отсюда: https://geektimes.ru/company/audiomania/blog/246304/
zerg59
06.01.2017 12:51Угу. Неравномерности АЧХ в 4-м знаке после запятой в логарифмической шкале ;-)
Тут где-то товарищ приводил порог различимости разных уровней громкости. Там было ЕМНИП 1 дБ.
Т.е. искажения АЧХ даже в самом пплохом случае на 4 порядка по величине меньше чувствительности человеческого уха.
Искажения АЧХ — линейные искажения. А их человеческое ухо воспринимает очень лояльно.
И пик в 0,0001 дБ,
а это в разах будет 1.00001, т е повышение амплитуды в 0,001%. Аналоговую часть это тоже не перегрузит.
И кстати да — там хорошие картинки насчёт разрядности и шума квантования.
zerg59
А разве линейные цепи могут породить нелинейные искажения?
progchip666
Это не суть важно, поскольку операционный усилитель является ещё тем нелинейным элиментом!
zerg59
Если «tutorial», то важно. Понятно, что в нашей суровой реальности нелинейность может возникнуть в самых неожиданных местах. Даже просто в паяном соединении в виде окисла. Но просто линейный фильтр с сильно кривыми АЧХ и ФЧХ сам по себе ничего нового (в смысле новых частот) в сигнал не внесёт.
Вот косвенно — да. Если искажения формы сигнала вызовут «clipping», т.е. ограничение сигнала из-за выхода его за допустимые рамки.
zerg59
Ещё про усилители: пример в статье с фазовыми искажениями хорош тем, что показывает, как один и тот же по громкости по ощущениям на слух сигнал может требовать разных по мощности усилителей. Нижний сигнал потребует более мощного усилителя, ибо его амплитуда выше. А вот мощность та же. А теперь возьмём реальный звуковой сигнал. Его на стадии сведения аккуратно вписали в динамический диапазон 16-битного формата. Воспроизводится он ЦАПом, имеющим вполне определённый максимальный размах. А вот если мы дальше поставим аналоговый фильтр, то из-за фазовых искажений, даже при расчётном коэффициенте пропускания в единицу сигнал может выйти за ожидаемые рамки, что вызовет кране мерзкие искажения в виже ограничения сигнала («clipping»).
SADKO
А вот это, судя по комментариям, до некоторых вообще не доходит, хотя проблема реальная, и актуальная даже для некоторых цифровых связок…
… из этих соображений в пресетах пиковых лимиттеров для CD, выходной уровень обычно около -0.3dB, хотя для последующего дитеринга даже с нойз шейпом этого запасу овер дофига