Цифровой звук. Как же много мифов крутится вокруг этой фразы. Сколько споров возникало между любителями удобства и качества цифры и приверженцами «живого воздушного» винилового звука помноженного на «тёплое ламповое» звучание. Кроме того, есть немало споров и между любителями «цифры»: достаточно ли 16х44.1 или нужно 24х192? Что лучше: мультибит или дельта-сигма? CDDA или SACD? PCM или DSD? В этой статье я попробую простым языком изложить азы цифрового звука, а так же более подробно остановлюсь на сравнении двух типов кодирования аналогового сигнала в цифровой: DSD и PCM.

Для начала ответим на вопрос, что есть цифровой звук? Чем он отличаются от аналогового? Если говорить кратко, математическим языком, аналоговый звуковой сигнал — непрерывная функция, цифровой звуковой сигнал — дискретная функция. Что это значит?

Аналоговый сигнал


Если нарисовать в воображении график синусоиды (именно так в чаще всего изображают звуковую волну): то, как бы мы его не увеличивали, стараясь рассмотреть все детали, — всегда будем видеть плавную гладкую линию: это аналоговый звуковой сигнал (рис. 1).


Рис. 1. Аналоговый сигнал

Аналоговый звук (запись) имеет множество параметров, с помощью которых можно оценить его качество. Рассмотри три самых важных: частотный диапазон, динамический диапазон, искажения.

Частотный диапазон — набор частот, содержащихся в звуке. Принято считать, что частотный диапазон человеческого слуха 20… 20.000 Гц (иногда указывается 16 — 22.000 Гц). Сам по себе частотный диапазон музыки никакого интереса в плане оценки качества не представляет (к примеру, частотный диапазон все того же взлетающего самолета будет очень широк, а вокальной партии тенора — намного уже). Качественным параметром, скажем, наушников является потенциальный частотный диапазон, а оценивается он с помощью амплитудно-частотной характеристики (АЧХ). Идеальная АЧХ — прямая линия на всем диапазоне частот слуха – означает, что источник звука не усиливает и не ослабляет какие-то отдельные частоты, а значит извлекаемый звук совпадает с оригиналом.


Рис. 2. АЧХ MP3 файла 256 kbps

Динамический диапазон (ДД) — разность между самым тихим и самым громким звуком. Измеряется громкость в децибелах (дБ). Принято считать, что максимальная громкость, не наносящая травм человеку — это 130 дБ — звук взлетающего самолета, а минимальная слышимая громкость — 5… 10 дБ — на уровне шелеста листьев в маловетреную погоду. Естественно, что шелест листьев на фоне взлетающего самолета разобрать будет невозможно, да и слушать музыку с уровнем 130 дБ крайне неприятно. Поэтому принято считать, что комфортный ДД для прослушивания музыки — 80… 100 дБ.

Искажения – ни что иное, как отклонение сигнала от оригинала.

Принципы представления звука в цифровом виде


Что же происходит при оцифровке аналогового звука? Не будем углубляться в технические аспекты, разберем все, как говорится, на бумаге: для этого нарисуем нашу воображаемую «идеальную» синусоиду и будем измерять величину сигнала через равные промежутки времени (этот процесс называется дискретизацией или квантованием): мы получим некий последовательный набор значений — это и будет наш цифровой сигнал, полученный методом импульсно-кодовой модуляции (PCM) (рис. 3).


Рис. 3. Преобразование аналогового сигнала в PCM

Два основных параметра качества PCM сигнала — это частота и разрядность. Частота — это количество измерений за одну секунду, чем их больше — тем с большей точностью передаётся сигнал. Частота измеряется в герцах: 44100 Hz, 192000 Hz и др. Разрядность — количество возможных значений величины сигнала (точность передачи величины). Чем больше вариантов — тем больше точность сигнала. Разрядность измеряется в битах: 16 bit (65.536 возможных значений, ДД 96 дБ), 24 bit (16.777.216 значений, ДД 144 дБ) и др.

Но это не единственный вариант представления звуковой волны в цифровом виде. Есть способ избавиться от такого параметра, как разрядность, оставить только два уровня амплитуды: -100% и +100% (0 или 1). Чтобы добиться этого, не потеряв в качестве, — нужно многократно увеличить частоту считывания величины сигнала (рис. 4).


Рис. 4. Преобразование аналогового сигнала в DSD

Такой вид представления цифрового звука называется импульсно-плотностной модуляцией, чаще всего для него используется аббревиатура DSD. Фактически, единственный качественный параметр такого сигнала — частота. Но так как частоты используются очень высокие (от 2.822.400 Hz), такие цифры сложно запомнить, принято делить частоту DSD сигнала на 44.100 Hz. Полученное число и является показателем качества: DSD64 (ДД 120 дБ), DSD128, DSD256 и т.д.

Восстановление аналогового сигнала из «цифры»


Но оцифровка аналогового сигнала – это полдела. Для прослушивания цифровой музыки нужно выполнить обратное преобразование. Для начала рассмотрим, каким образом превратить в звук цифровой DSD поток. Как мы уже знаем, этот поток представляет из себя высокочастотный (2,8 МГц и более) двухуровневый сигнал, средняя величина этого сигнала меняется со звуковой частотой. То есть, если подходить к решению задачи максимально просто, — нужно отфильтровать все высокочастотные составляющие DSD потока, оставив только полезный звуковой сигнал (частоты до 20...22 кГц). Делается это с помощью аналогового фильтра низкой частоты (ФНЧ). Простейший ФНЧ – это RC цепочка. Сигнал полученный, после прохождения этой цепочки, показан на рис. 5.


Рис. 5. Восстановление аналогового сигнала из DSD

Как видим, полученный график лишь отдаленно напоминает исходную синусоиду. Но не забываем, что мы «применили» простейший фильтр, улучшая схему фильтра можно добиться практически полного отсутствия высокочастотного шума и получить аналоговый звук с хорошими качественными показателями.

Для восстановления аналогового сигнала из цифрового PCM недостаточно только лишь аналогового ФНЧ, нужно предварительно расшифровать цифровые данные, для этого используются цифро-аналоговые преобразователи (ЦАПы). Бывают они разных типов, но описывать их все в задачи данной статьи не входит. Остановимся на 2-х самых распространённых типах в звуковой технике. Во-первых, это так называемый ЦАП лестничного типа (его ещё называют мультибитным). Как вы, наверное, догадались, такой ЦАП преобразует PCM поток цифровых данных в поток величин звукового сигнала, которые на графике выглядят как лестница (рис. 6). Как и в случае DSD, обязательно использование аналогового фильтра для сглаживания «ступенек».


Рис. 6. Восстановление аналогового сигнала из PCM

Зачастую, в таких преобразователях используется промежуточная передискретизация цифрового PCM сигнала в более высокие значения частоты (например, 192 кГц): это уменьшает «ступеньки», что позволяет упростить схему аналогового фильтра.

Второй тип ЦАП – дельта-сигма – использует передискретизацию в ещё большие значения частоты с одновременным уменьшением разрядности до одного бита. Ничего не напоминает? Это же знакомый нам DSD сигнал! Как далее обработать такой сигнал и превратить его в аналоговый, мы уже рассматривали выше.

Применение PCM и DSD, достоинства/недостатки


Где же мы можем встретить каждый из способов кодирования? PCM формат очень распространён: CDDA диски, DVD Audio, файлы MP3, FLAC, ALAC, AAC, звук в фильмах, и далее, и далее, проще сказать, когда не-PCM. Super Audio CD диски, DSD диски, файлы DSF, DFF — это DSD формат. Что же всё-таки лучше? При воспроизведении какого формата мы получим более качественный звук?

В статьях, посвященных DSD формату, описано множество преимуществ перед PCM, но все ли описываемые преимущества верны или это мифы, придуманные для обывателей, не разбирающихся в технической составляющей, чтобы отвоевывать рынок, плотно занятый PCM форматом? Давайте кратенько пройдемся по списку.

  1. Первое преимущество, которое любят приводить сторонники DSD, довольно расплывчатое — помехоустойчивость и снижение влияния ошибок. Странно слышать про разную помехоустойчивость в цифровом мире: оба формата подвержены помехам ровно настолько, насколько подвержена помехам книжка в цифровом формате. Длительность хранения любого цифрового формата или качество передачи его между устройствами зависят только от носителя / способа передачи, но не от самого формата. Итак, помехоустойчивость одинаковая. А что по поводу снижения влияния ошибок? Допустим, мы храним 2 альбома на оптических дисках (один PCM, другой DSD), что будет, если диск поцарапать? При чтении поврежденного носителя будут возникать ошибки, но насколько они критичны? В PCM кодировании используются многоразрядные числа, ошибка в старшем разряде очень критична (как пример, разница между десятичными числами 11 и 91): на слух это будет ощущаться, как щелчок. В DSD кодировании один бит информации имеет небольшой вес в общем потоке, нечастые ошибки будут вызывать лишь повышение фонового шума, что на слух будет менее заметно.
  2. Второе преимущество описывается чуть конкретнее: больший динамический диапазон по сравнению с PCM. Что же, и здесь есть некоторое лукавство, ДД больше лишь по сравнению с классическим CDDA форматом: 120 … 140 дБ против 96 дБ. Если же сравнивать, например, с DVD Audio — ДД примерно одинаков.
  3. Третье преимущество: DSD более прост технически. Вот здесь поспорить не с чем: более простое декодирование сигнала, отсутствие необходимости синхронизации и буферизации потока при передаче сигнала с одного устройства на другое — полная победа DSD. Кстати говоря, на фоне этого преимущества странно видеть заоблачные цены на аппаратуру, поддерживающую воспроизведение DSD.
  4. Ну и ещё одно преимущество, которое любят приводить фанаты DSD: музыка в этом формате наиболее близка к оригинальному аналоговому звуку. Аргументируется это тем, что современные аналогово-цифровые преобразователи (АЦП) — работают на принципе дельта-сигма модуляции, то есть эти АЦП выдают цифровой DSD поток. И вот опять лукавство: запись будет полностью оригинальной только в случае прямой записи живого выступления либо при оцифровке готовой аналоговой записи с качественного носителя. Операции сведения, наложения эффектов, мастеринга, даже простой подстройки громкости — всего того, без чего не может обойтись создание студийного альбома, — невозможны для цифрой DSD записи по причине отсутствия нормальных алгоритмов ее обработки. Это означает, что все эти операции производятся с PCM форматом, и только после этого готовая PCM запись конвертируется в DSD. Впрочем, нужно отметить, что преобразование PCM > DSD и обратно — достаточно точное: лишь немного возрастает шум за пределами реального динамического диапазона (рис. 7). А значит, не имеет особого значения, в каком формате слушать запись: PCM Hi-Res или DSD — оба формата по качественным характеристикам очень схожи. Так же, фактически, нет смысла покупать отдельную звуковую карту для воспроизведения DSD, послушав совета приятеля, фаната данного формата.


    Рис. 7. Динамический диапазон / шум при преобразовании между DSD и PCM

Выводы


Итак, что выбрать DSD или PCM? Однозначного ответа нет и быть не может: PCM 24 бит 92 кГц и DSD128, например, очень схожи по качественным характеристикам, причем эти характеристики лучше, чем у аппаратуры, на которой эти форматы будут проигрываться, а значит дальнейшее увеличение качества цифровых форматов для воспроизведения на данном этапе нецелесообразно. При оценке качества звука разных форматов высокой чёткости на первый план выходят субъективные ощущения, ведь не качеством единым питается человеческий мозг: дизайн аппаратуры, ее стоимость, и, главное, самочувствие и настроение слушателя дают гораздо больший эффект на ощущения от прослушивания музыки. А значит выбирайте то, что нравится лично вам, и не навязывайте другим свое мнение. Всем приятного прослушивания!

Комментарии (8)


  1. bigfatbrowncat
    21.01.2016 12:38

    Оба метода ЦАП основаны на «баллистике». То есть в обоих случаях для преобразования используется некий «массивный» элемент (в случае электроники — элемент с большим импедансом), который «дергают» с высокой частотой в нужном направлении, из-за чего он плавно ползет туда, куда нужно. А слушатель, в свою очередь, воспринимает уже звук, производимый движением этого «массивного» элемента. Качество перекодирования при этом определяется тем, насколько правильно подобран импеданс. Если он слишком маленький, то подергивания не будут полностью сглажены, создастся высокочастотный шум (который, кстати, можно часто слышать в звуке дешевых игрушек типа поющих елочных гирлянд). Если слишком большой, то уже полезные высокие частоты исходного сигнала будут потеряны.

    Так что, как мне кажется, холивара тут нет. Оба метода абсолютно равноправны в плане потребительских свойств. Качество на выходе от выбора способа кодирования не зависит. Неоспоримое достоинство более популярного PCM, на мой взгляд, состоит в его наглядности и простоте кодирования/декодирования и обработки. Просто умножить аналоговый сигнал на глубину разрядности и округлить — что может быть проще! К тому же, PCM очень легко обобщается на использование плавающей точки. Что существенно для обработки звука.

    С другой стороны, DSD чрезвычайно удобен для ШИМ…


    1. Soolo
      21.01.2016 12:51
      +3

      Самое главное преимущество PCM в том, что его можно обрабатывать: от простой регулировки громкости до любой многоступенчатой обработки «сложными» эффектами. С DSD в этом плане всё печально: нормальных алгоритмов прямой цифровой обработки нет, выход только один — преобразование DSD > PCM и дальнейшая работа с PCM.


      1. bigfatbrowncat
        21.01.2016 12:57

        Согласен. Отсюда вывод. DSD полезен там, где надо как можно более просто выдать звук. То есть, например, автомобильную сигнализацию надо делать с прошивкой в этом формате :) А на компьютере лучше, всё же, использовать PCM.

        Тут есть еще один фактор, о котором я не подумал — устойчивость к ошибке.
        Один испорченный бит в PCM приведет к очень неправильному семплу и явному щелчку на дорожке.

        Один испорченный бит в DSD приведет к очень небольшому отклонению. Артефакт будет, но он будет почти неразличим. В этом плане при передаче сигнала по ненадежному каналу (типа телефонного) использование DSD было бы более целесообразно.


        1. Soolo
          21.01.2016 13:50

          По поводу ошибок: довольно сложно придумать ситуацию, когда возможно появление ошибок.
          Есть, естественно, вариант повреждение носителя (оптический диск, винчестер, флешка).
          И есть некий гипотетический вариант передачи «незащищённого» DSD потока (без применения протоколов передачи данных) на большие расстояния.


          1. bigfatbrowncat
            21.01.2016 15:02

            Первый из перечисленных вами я наблюдаю у себя в автомобиле. «Заезженный» CD — как заезженная пластинка. Скрипит и хрюкает.

            Второй… А почему бы, собственно, нет? Иногда защита данных не столь критична, как факт передачи. Например, при передачи их из/в космос.


            1. Anisotropic
              21.01.2016 15:07

              У вас в машине SACD плеер, или обычный CD?


          1. sci_nov
            22.01.2016 15:54

            На CD используются корректирующий код и перетасовка байтов.


        1. Mii
          22.01.2016 13:25
          -1

          Артефакт будет, но он будет почти неразличим.

          Дробное различие — это сильно. Смысл в том, накопленные неразличимые отличия в растяженном по времени сигналу (треку) и составляют разницу в качестве тракта