Одно из самых интересных событий, которые произошли в мире аудио за последние годы — небывалый рост популярности форматов высокого разрешения (Hi-Res). Среди причин появления в своё время новых форматов — неудовлетворённость качеством звучания CD, ведь на заре эпохи компакт-дисков все звукозаписывающие лейблы спешили переиздать свой аналоговый каталог на цифровом носителе, мало заботясь о качестве: хотя бы плюс-минус привлекательное и лишённое всевозможных щелчков и прочих шероховатостей звучание уже казалось победой.

Таким образом, производители аппаратуры и звукозаписывающие лейблы начали выполнять свои обещания о высочайшем качестве звучания CD далеко не сразу. В результате, в умах многих аудиофилов формату был нанесен непоправимый ущерб, а CD превратились в этакого цифрового «злодея». Впрочем, забегая вперёд, стоит отметить, что компакт-диски способны звучать совершенно замечательно — при условии высочайшего качества исходной записи, а также при должном внимании к мастерингу и продюсированию. Но обо всём по порядку.

В последнее время мы стали свидетелями возвращения к винилу, а также отмечаем рост интереса к цифровым файлам высокого разрешения. Но не подстерегает ли нас опасность угодить в ловушку 1970-х, когда всё внимание было приковано только к техническим характеристикам? Чтобы ответить на этот вопрос, порассуждаем о том, как и что именно мы слышим, а также о реалиях хайрез-записи.

Для начала, затронем техническую сторону вопроса. Формат CD с 16-битным квантованием и частотой дискретизации 44,1 кГц позволяет записать аудио в диапазоне частот от 0 Гц примерно до 22 кГц (то есть, чуть шире возможностей человеческого слуха) и динамическим диапазоном порядка 95 дБ, чего вполне достаточно для подавляющего большинства музыкальных инструментов. При этом формат 24 бит 48 кГц расширяет динамический диапазон до 150 дБ, а верхнюю частоту — до 24 кГц. Более того, многие аудиофилы предпочитают 24 бит 96 кГц, с верхней частотой до 48 кГц, а также 24 бит 192 кГц, с верхней планкой в районе 96 кГц. Столь высокие звуковые частоты оказываются далеко за пределами возможностей человеческого слуха, так что здесь напрашивается простой и резонный вопрос: для чего же собственно всё это нужно?

Некоторые сторонники Hi-Res скажут, что хоть ничего и не слышат на этих частотах, но всё же могут «почувствовать» разницу, зачастую преподнося это как более высокую «воздушность» звучания. При этом любопытно, каким именно органом чувств они ощущают эту воздушность? В общем-то, мы и вправду можем «почувствовать» очень низкие частоты — при условии, что они воздействуют с высокой амплитудой и с относительно близкого расстояния. Ну а что же касается поклонников Hi-Res, скорее всего, они воспринимают звучание более плавным и слитным из-за высокой частоты дискретизации. К тому же, АЦП и другие компоненты, используемые во время записи в 192 кГц, скорее всего, будут высокого качества, что само по себе повлияет на впечатления от прослушивания.

Для того, чтобы проверить на практике преимущества Hi-Res, все желающие могут провести любопытный тест — послушать в случайном порядке несколько записей с разной частотой дискретизации на хорошем цифровом аудиоплеере. Заклейте чем-нибудь подручным дисплей проигрывателя, чтобы не иметь представления о том, с каким именно разрешением в данный момент воспроизводится файл. Вооружитесь ручкой и блокнотом (ну или приложением «заметки» в смартфоне), прослушайте все записи и отметьте, что именно вы слышите и какой трек звучит лучше. Если у вас получается точно определить более высокие частоты дискретизации, можно с уверенностью заявить, что вы обладаете необыкновенным слухом.

Большинство людей старше среднего возраста способны услышать тон на частоте максимум до 15 кГц. К возрасту 60 лет эта частота может снизиться примерно до 12-13 кГц для среднестатистического мужчины (и, возможно, будет немного выше для женщин). Таким образом, звуковой сигнал с частотой 96 кГц мало что значит для восприятия звука. Однако вполне вероятно, что многие слушатели почувствуют дополнительную плавность и слитность на средних частотах, которой может похвастаться Hi-Res. Впрочем, на качество звучания записей влияет и множество других факторов, некоторые из них играют очень важную роль.

К примеру, можно задаться вопросом, с помощью какого оборудования осуществляется запись. Ведь, по иронии судьбы, многие профессиональные конденсаторные микрофоны от Sennheiser, Beyerdynamic, AKG, Neumann, Shure, Rode и Audio Technica обладают частотными характеристиками, которые стремительно снижаются сразу после 20 кГц. Более того, у некоторых популярных микрофонов заметный спад начинается уже после 18 кГц: таким образом, они вряд ли будут улавливать что-либо на частоте 48 или 96 кГц, и в большинстве случаев это как раз хорошо, ибо не очень-то и хочется вводить высокочастотный шум в цепь микширования.

Итак, для того, чтобы записать аудио с действительно «высоким разрешением», в первую очередь, потребуются специальные микрофоны, способные улавливать очень высокие частоты, не внося при этом слишком много собственного шума. Далее нам необходимы микрофонные предусилители и микшеры с расширенной частотной характеристикой и сверхнизким уровнем шума, а также высококлассный аналого-цифровой преобразователь. Предположим, что у нас есть микрофоны с равномерной частотной характеристикой от 20 Гц до 96 кГц и сверхнизким уровнем шума, подключенные специальными аудио кабелями к сверхмалошумящему предусилителю. Далее мы отправим этот сигнал в секцию микширования и высококлассный аналого-цифровой преобразователь, который передаёт аудиосигнал высокого разрешения в цифровой рекордер или компьютер с аналогичными улучшенными характеристиками.

И в общем-то, да, всё это действительно осуществимо. Более того, записав таким образом соло скрипки в 24 бит 96 кГц, можно заметить, что на самых высоких нотах некоторые гармоники достигают частоты приблизительно 28 кГц. Подобные гармоники может давать и флейта сопрано, но вот способны ли мы их услышать — это уже другой, не менее интересный вопрос. В конечном итоге, практически весь значимый для нашего слуха звуковой сигнал в записях соло скрипки вполне может содержаться на 16-битном CD с частотой дискретизации 44,1 кГц.

Вдвойне удивительно, что даже полноценный оркестр, с его широчайшим динамическим диапазоном, вполне можно записать в 16 битах, при условии изначально правильной настройки уровней (не прибегая к компрессии). Безусловно, не стоит забывать, что вполне возможно сгенерировать электронные звуки, которые выходят за пределы частотного диапазона человеческого слуха и динамического диапазона в 100 дБ. Но всё это остаётся, как правило, на уровне теории.

В заключение стоит отметить, что благодаря более высокой плавности и слитности звучания в среднечастотном диапазоне, Hi-Res записи однозначно достойны внимания слушателей, но только при условии, что аудиосистема позволяет воспроизвести все эти нюансы.

Любопытно, что у многих аудиофилов есть любимые записи классической музыки, сделанные в конце 50-х и начале 60-х годов. Ведь музыка — это не только технические характеристики, а определяющим фактором зачастую является исполнение и профессионализм звукорежиссёра, что позволяет сделать хорошую запись даже с минимальным набором микрофонов. А послушав некоторые джазовые записи, сделанные в начале 60-х годов, нельзя не отметить, что они звучат очень живо и музыкально: может быть, не так уж и важно, что они не в Hi-Res.

Комментарии (47)


  1. RigelNM
    10.10.2021 14:55
    +13

    Был у меня опыт взаимодействия с пульт.ру в Пермском отделении. Пришел с запросом - подобрать хороший 7ми канальный AV - ресивер для прослушивания музыки (ну вот такой у меня запрос, мне больше нравится объемность звучания музыки, чем слышать слабые покашливания на заднем ряду через стерео). В итоге поняв, что потратил 10 минут на пустой спор с продавцом, что я вообще ничего не понимаю в прослушивании музыки и вообще "мальчик тебе чего?", я ушел в уютный "семейный" салон, где оставил свои 150 тыс. и получил чего хотел.


    1. AlexTOPMAN
      11.10.2021 10:32

      Я считаю, что дискуссию про качество звука следует начинать следующим образом: взяли мы красивую мелодию 1 скрипки и записали в макс. CD качестве, выбрав, как и полагается качественной записи, ещё и весь доступный битрейт. Ок, берём это качество за условные 100% для сравнения. А теперь мы хотим добавить ещё 1 скрипку (и далее сразу транслируем выводы на то, что мы подключаем целый оркестр в итоге). Вопрос: каким-таким "Макаром", не изменяя ттх записи нам удастся не снизить её качество как в целом, так и отдельно той самой первой скрипки? Не для того ли нам нужны все эти 24/192, чтобы чисто технически упихнуть в даваемый ими битрейт максимум разных звуков, минимально теряя в их качестве, различимости и пр. "аудиофильских эпитетах" (на самом деле, пытающихся заменить некие отсутствующие необходимые нам технически измеряемые параметры для описания тех же вещей)?


      1. ganzmavag
        11.10.2021 14:37
        +1

        Вы не с той стороны заходите. В CD битрейт не адаптивный и не проходит сжатие. Поэтому там и абсолютная тишина будет закодирована с тем же битрейтом.

        Проще говоря, эти ~ 1400 кбит/с стоит воспринимать скорее как максимально возможный для данного формата. Как если там будут все звуки от 20 до 22000 Гц с динамическим диапазоном от 0 до -95 Дб.

        Споры идут о другом. Может ли человеческое ухо слышать, что звук "раздроблен" 44100 раз в секунду и улавливать разницу между звуками, разница между которыми больше чем в 95 Дб. Ну и хватает ли ему 65536 ступеней громкости.


        1. AlexTOPMAN
          11.10.2021 15:09

          Ок, пусть споры о другом. Но, уже в этом ключе, разве понятие 44100 Гц квантования не заканчивается ещё перед диффузором играющего динамика, звуковую волну (аналоговую) от которого и слышит уже человек?


          1. ganzmavag
            11.10.2021 22:27

            Не заканчивается. Волна же будет разной в зависимости от того, что было на входе.


            1. AlexTOPMAN
              12.10.2021 10:38

              Форма, размер и т.п. - нет, одинаковые. Квантизация же всего лишь интерполяционная характеристика волны. Волна "ломается" когда квантизация слишком низкая. А тут запас многократный. Я именно на этом основании и заявил, что "заканчивается".


  1. thousandsofthem
    10.10.2021 15:16
    +3

    >тест — послушать в случайном порядке несколько записей с разной частотой дискретизации на хорошем цифровом аудиоплеере

    Разница вполне может быть довольно заметная - чистая схемотехника, разные частоты по разному обрабатываются внутри, и это отличие зависит от конкретного DAC на котором слушают. Вот если все записии апсэмплить в максимально поддерживаемый формат и слушать так - тогда да, хотя тоже есть нюансы


    1. AntonioXXX
      10.10.2021 23:07
      +2

      Если не ради науки, а для себя, чтобы понять какие записи качать, то норм эксперимент.

      Но можно ошибиться, иногда бывает разный мастеринг для CD и для цифрового релиза 24/96. А иногда лучший мастеринг оказывается в GuitarHero)


  1. Borjomy
    10.10.2021 15:24
    +4

    Для начала надо определиться с динамическим диапазоном... усилителя. А его динамический диапазон и уровни шумов в принципе не могут дотянуть до 100дБ. Тут возникают ограничения на уровне физики.
    Мало того, ни один даже самый лучший выпускаемый 24 бит дельта-сигма АЦП не может оцифровать сигнал с точностью выше 18 (максимум -20) разрядов на частоте дискретизации. Вот если взять и измерять значение в течение нескольких секунд, то точность будет повышена в корень от соотношения частот.
    Основной цимес тут все-таки в принципиальном отличии типов оцифровки - 16 битные АЦП - дешевые (но быстрые) АЦП последовательного приближения, которые могут ловить помехи выше одной второй частоты дискретизации, отражая их в нижние частоты и внося искажения, которые невозможно чисто математически выделить. Для предотвращения этого необходимы аналоговые фильтры, которые вносят свои искажения, особенно сильно на высоких частотах. Получается прокрустово ложе.

    Дельта-сигма АЦП такого недостатка лишены. Но лишь в последнее время был достигнут прогресс в части повышения частоты дискретизации. Изначально дельта-сигма АЦП были очень медленные, их основная сфера применения была сверхточное измерение медленно меняющихся процессов. Также большая проблема на таких разрешениях - сверхмалошумящий источник опорного напряжения, потому что все шумы и дрейфы от него уходят в оцифрованный сигнал. А уменьшить уровень шума кремниевой аналоговой электроники в 200 раз (приблизительно 8 бит) задача технически почти невозможная. Однако такой АЦП не требует использования входных фильтров, соответственно, он может на всем диапазоне частот одинаково точно оцифровывать сигнал.


  1. Dim0v
    10.10.2021 15:52
    +13

    Понимаю, что это перевод, но все же.

    благодаря более высокой плавности и слитности звучания в среднечастотном диапазоне, Hi-Res записи однозначно достойны внимания слушателей

    Что конкретно имеется в виду под плавностью и слитностью звучания?

    Частота дискретизации влияет исключительно на доступный частотный диапазон. Причем это влияние без градаций: просто есть предел, выше которого звуки передать не выйдет. Расширение этого диапазона никак не улучшит запись частот, которые в него и так входили. Звук с частотой 880 Гц, записанный с частотой дискретизации 44,1 кГц будет звучать абсолютно аналогично тому-же звуку, записанному с частотой дискретизации 192 кГц.

    Разрядность квантования влияет на динамический диапазон и привносит шумы. Что в теории может и могло бы улавливаться на слух, но насколько мне известно, качественно поставленных экспериментов, это подтверждающих, особо нет. Имеется в виду для 16+ бит, разумеется.

    Ну и отдельно камень в огород переводчиков. Вот эта картинка, которую вы, судя по всему, добавили для наглядности (в исходной статье ее нет) - не имеет ничего общего с реальностью. Нет в 16-битном звуке никакой лесенки. На выходе будет такая-же плавная синусоида. Хоть с 16 битами, хоть с 4. Хоть с 192 кГц дискретизацией, хоть с 16 кГц. Просто у 4 бит форма этой синусоиды будет сильнее отличаться от оригинала, чем у 24 бит.

    В целом единственное реально полезное применение у форматов с повышенной разрядностью квантования и повышенной частотой дискретизации - это при записи и мастеринге. Там многие манипуляции с дорожками могут расширять и динамический диапазон звука, и частотный. Поэтому банально удобно иметь запас. А вот для прослушивания зачастую даже полезно иметь исходник, в котором обрезано все что выше 22 кГц. Потому что этот высокочастотный писк, будучи скормленным устройству, которое не умеет адекватно его воспроизводить, может порождать артефакты на более низких частотах.


    1. Ddnn
      11.10.2021 00:58
      +2

      Хотел тоже поругать статью за неграмотную картинку, но вы уже это сделали за меня) Всем сомневающимся - советую очень наглядную демонстрацию в видео (https://wiki.xiph.org/Videos/Digital_Show_and_Tell, есть текстовая расшифровка)

      По поводу Hi-Res музыки есть старая, но все еще актуальная статья - https://web.archive.org/web/20180307183656/https://people.xiph.org/~xiphmont/demo/neil-young.html (ссылка на web-archive - на оригинальном сайте ее уже нет) и ее обсуждение на hackernews (https://news.ycombinator.com/item?id=15127633)


    1. soul32bit
      11.10.2021 03:27
      -1

      8 плюсов, мне грустно… «На выходе будет такая-же плавная синусоида. Хоть с 16 битами, хоть с 4.»… «Просто у 4 бит форма этой синусоиды будет сильнее отличаться от оригинала, чем у 24 бит.» Логика просто фантастическая… Это не просто «хромая лошадь», это вообще лошадь без ног. И таки да, если взять в руки паяльник, х резисторов, собрать 4-х битный цап, подать злополучные 880 Гц, то на осциллографе мы увидим… лесенку, мать её так! Вот зачем вы придрались к картинке, которая значительно ближе к реальности, чем этот ваш «Звук с частотой 880 Гц»? Согласен с вами, что высокая разрядность удобна в цифровой обработке сигнала, но если вы застали времена, когда звук издавался пищалкой PC (1 bit), то вы согласитесь, что разрядность цапа тоже имеет значение. p.s. (флуд про фильтры на выходе предлагаю пропустить)


      1. Dim0v
        11.10.2021 12:35
        +4

        флуд про фильтры на выходе предлагаю пропустить

        С вашего позволения, предложение я отклоню. Фильтры на выходе - такая-же часть ЦАП, как и все остальное (х резисторов в вашем случае).

        Во-первых, ЦАП в целом и его разрядность в частности - вещи немного ортогональнальные формату хранения (в статье именно об этом - о форматах хранения). И этих сохраненных данных достаточно для восстановления плавного сигнала без лесенок. Хоть с 4 битами, хоть с 24.

        Во-вторых, даже реальные аудио ЦАП не выдают никакой лесенки. Да, они могут привносить (и привносят) искажения. Но сигнал на выходе при этом все равно плавный и без лесенок. Хоть с 4 битами, хоть с 24 битами. То что вы можете собрать плохой ЦАП без low-pass фильтра - это конечно круто. Но не очень понятно, что это должно доказать. Реальные ЦАП этот фильтр имеют и лесенок не выдают.

        но если вы застали времена, когда звук издавался пищалкой PC (1 bit), то вы согласитесь, что разрядность цапа тоже имеет значение

        Во-первых повторюсь, что речь про ЦАП вообще не шла. Ни в статье, ни в моем комментарии. Во-вторых, даже про разрядность квантизации никто не писал, что она не имеет значения. Имеет. Просто для 16+ бит и человеческих ушей это значение пренебрежимо мало. И любая сколь угодно низкая разрядность (даже 1 бит) не означает автоматически наличие лесенок. Лишь обилие шумов и низкий динамический диапазон. Лесенки будут только с плохим ЦАП без ФНЧ.

        Вот зачем вы придрались к картинке, которая значительно ближе к реальности, чем этот ваш «Звук с частотой 880 Гц»

        Затем, что к реальности картинка отношения все же не имеет. Потому что лесенка на ней подается как готовый выходной сигнал, который мы слышим. На деле же это в лучшем случае промежуточное представление сигнала внутри некоторых видов DAC. Но даже у них на выходе никаких лесенок нет (если конечно у DAC стоит цель восстановить исходный сигнал, а не какая-то другая).


  1. PKav
    10.10.2021 16:02
    +5

    Как по мне, всё, что выше CD-Audio равносильно разрешению FullHD и 4K на 5-дюймовом дисплее смартфона. Да, оно гарантированно лучше передаёт детали, но человеческие органы чувств не способны уловить данных улучшений. Более того, даже совсем престарелый формат сжатия с потерями MP3 при использовании современных кодеров показывает довольно высокие результаты на битрейте 128 кбит/с, вплоть до того, что люди не могут найти отличий и путаются в том, где сжатие с потерями, а где оригинал. https://www.youtube.com/watch?v=ZvzqYuimxlE


    1. Gnuava
      10.10.2021 21:47

      равносильно разрешению FullHD и 4K на 5-дюймовом дисплее смартфона

      Вы удивитесь, но в случае эксплуатации Google Cardboard-подобных очков со смартфоном, предпочтительнее будет все же 4K разрешение на последнем.

      но человеческие органы чувств не способны уловить данных улучшений

      Способны, только оборудование нужно не с динамическими излучателями, а с электростатическими: там даже отдельные инструменты становятся легкоразличимыми на слух, не звучащими из общей "бочки". Любое же lossy-кодирование смешивает их обратно.


      1. Gnuava
        10.10.2021 21:51

        Кстати, после перехода на электростаты разучился понимать различия между lossless 44/16 и более высокими разрешениями - на обычных наушниках казалось, что 24-битные поярче звучали, но не более того, тут же - отличий вообще никаких.

        Чудеса.


        1. PrinceKorwin
          11.10.2021 11:02

          Не подскажите модель наушников и усилителя к ним? Как они вам "зашли"?


          1. Gnuava
            11.10.2021 14:36

            KOSS ESP/950, сейчас в продаже они идут, как Massdrop x Koss ESP/95X

            Зашли настолько, что прекратил уважать винил, и все, что с ним связано.

            Где-то с месяц ловил вау-эффекты с множества треков, пока не привык.

            Но, на самом деле, кмк, зайдут любые другие модели электростатов - там другая технология, из-за чего и звук другой.


  1. AndreyDmitriev
    10.10.2021 16:12
    +2

    Повышенная частота семплирования позволяет более точно получить исходный сигнал. 44,1 кГц выбрана не случайно - тут работает теорема Котельникова-Шеннона-Найквиста, которая гласит, что "что для сигнала, представленного последовательностью дискретных отсчетов, точное восстановление возможно, только если частота дискретизации более чем в 2 раза выше максимальной частоты". Но если представить себе синусоиду сигнала 22 кГц и расставить на ней отсчёты на 44,1 кГц, то станет видно, что у нас есть грубо говоря один отсчёт с небольшим на полупериод, но тем не менее мы можем получить 22 кГц. Увеличение частоты дискретизации до 192 кГц даст возможность получить верхнюю границу на 96 кГц (что ушам не нужно), но, кроме того добавит в несколько раз больше значений и меньшим частотам, (что ушам очень хорошо). Практически же я собрал себе простенький бюджетный комплект из HiFi Berry (формально поддерживает 192kHz/24bit), усилителя Denon upa f88 и колонок Kenwood ls 880a и гонял cd и оцифровки пластинок. Разница в качестве от повышенной дискретизации гомеопатическая, впрочем некоторые оцифровки звучат офигенно, но я это связываю с тем, как оно оцифровывалось, а не с повышенной частотой. Ну и комплект у меня специфический - не любая музыка играет на нём хорошо.


    1. omxela
      10.10.2021 23:57
      +5

      Спасибо, что написали про теорему К-Ш-Н, а то уж я думал, мне придётся. Лень же. Все, кто работал с цифровыми сигналами, в частности, с преобразованием Фурье, - их ночью разбуди, спроси про частоту Найквиста, так все ответят: вдвое больше граничной частоты спектра. Но вот с такой трактовкой

      кроме того добавит в несколько раз больше значений и меньшим частотам, (что ушам очень хорошо)

      я бы не очень согласился. То есть, что точек на период синусоиды будет больше - это факт. Но что уши это услышат - не факт. Собачьи уши - да, у них граничная частота выше. Но если мы признаём, что у человеческих ушей граничная частота 20 кГц, то что вы им не подсуньте (хоть треугольники) - они сами сделают синус, поскольку выше гармоник они (уши) не слышат. Поэтому нашим ушам что 5 точек на период 20-ти кГц, что 10 точек - принципиально без разницы. То есть (имхо), цифруя выше 48 кГц, вы просто перегружаете усилитель паразитным ультразвуком. Я полностью согласен с автором коммента выше (Dim0v) - следовало бы просто резать спектр входного сигнала выше 22 кГц. Всем было бы спокойней.


      1. GospodinKolhoznik
        11.10.2021 01:01
        +4

        Я тоже никогда этого не понимал. Мол, да, человек не слышит частоту больше 22 кГц (на самом деле и выше 18 мало кто слышит), но якобы он при этом чувствует гармоники таких частот в более низком тоне. Звучит как мистика какая то. Не подтверждается ни здравым смыслом ни слепым тестированием.

        А то, что все повадились лослесс формат слушать это понятно. Бесплатный способ почувствовать себя аудиофилом.

        Хотел тут добавить нравоучений о том, что вместо погони за битрейтом лучше бы люди повышали музыкальный вкус... Но нафиг. Никого не хочу обижать.


    1. Dim0v
      11.10.2021 02:13
      +4

      но, кроме того добавит в несколько раз больше значений и меньшим частотам, (что ушам очень хорошо)

      Мягко говоря, неожиданный вывод непосредственно после упоминания теоремы Найквиста.

      Да, значений будет больше. Но все эти добавленные значения абсолютно побоку и ушам, и ЦАП, и динамикам. Синусоида 22 кГц, семплированная и с 44,1 кГц и со 192 кГц, и со 100500 гГц может быть восстановлена в своем первозданном виде. Да, даже если есть всего лишь "отсчёт с небольшим на полупериод".

      В качестве чуть более простой аналогии можете представить, что восстанавливаете не график суммы синусов, а график простого полинома. Аналогия практически идеальная, если степень полинома воспринимать как аналог частоты.

      Если вам нужно семплировать прямую, то для этого будет достаточно двух точек. И из них можно будет восстановить всю прямую. Вот прямо от минус бесконечности до плюс бесконечности. Вы можете взять на этой прямой 3 точки, 5 точек, или 10. Но прямая, восстановленная по 10 точкам будет точно такая-же, как и прямая, восстановленная по 2 точкам. Да, график параболы по 2 точкам уже не восстановишь, потребуется 3. А для полинома 9 степени - все 10. Но если наши "уши" "слышат" только полиномы 2 степени, а все более высокие степени "отфильтровывают", то брать больше 3 семплов нет никакого смысла. Достаточно перед взятием семплов так же отфильтровать входной график, выкинув из него члены со степенями 3 и выше.

      То же самое и с синусами. Если во входном сигнале обрезать частоты выше 22 кГц (а оставлять их нет смысла, ибо ухо не услышит), то частоты семплирования в 44,1 кГц будет достаточно, чтобы из полученных семплов восстановить исходный сигнал один-в-один.


      1. AndreyDmitriev
        11.10.2021 07:34
        +2

        Как вы понимаете - трактовка теоремы рассматривает идеальный случай, когда сигнал начался бесконечно давно и никогда не закончится. В реальной жизни исходный аналоговый аудиосигнал конечен во времени и один этот факт делает его восстановление невозможным, как бы мы не старались, я только это хотел сказать.


        1. evtomax
          11.10.2021 11:25
          +5

          Уже на первой секунде воспроизведения погрешность восстановления опускается намного ниже шумов квантования.


    1. FSA
      11.10.2021 16:01

      Там очень красивая математика есть, которая описывает суть процесса. По своей сути ИКМ сигнал, кроме оригинального сигнала несёт в себе множество амплитудно-модулированных копий исходного сигнала. Самая первая составляющая имеет несущую частоту равную частоте дискретизации. Боковые составляющие уходят, как и при обычной АМ в низ и вверх по спектру. Отсюда и необходимость брать частоту минимум в раза выше максимальной частоты спектра полезного сигнала, т.к. в этом случае эти самые дополнительные составляющие смешаются с полезным сигналом и исходный сигнал невозможно будет выделить. При таком раскладе, чтобы обеспечить качество сигнала необходимо:

      1. Перед дискретизацией обеспечить отсутствие в исходном сигнале частот, в двое превышающих частоту дискретизации.

      2. После декодирования сигнала обеспечить срез частот, которые заведомо выше максимальной частоты полезного сигнала.

      При выполнении этих двух условий исходный и декодированный сигнал будут практически идентичны.


  1. Gromushka
    10.10.2021 17:46
    +3

    Вообще-то все не совсем так, точнее совсем не так.

    Музыку мы слушаем через приборы, ухо - один из них, динамики - второй.

    Если динамик поддерживает колебания с частотой до 50КГц и они есть в записи, неважно слышим мы их или нет, они там будут.

    Далее - мы слышим не только ушами, мы воспринимаем, например, низкие частоты, через тело, те же 15Гц, которые не будут звуком, будут восприниматься как давление, а верхние через кости тела и отдельные части, мы тоже не слыша, воспринимаем.

    У меня сейчас нет данных по восприятию частот от 20КГц до 40КГц человеком (не ухом) - это надо искать, может кто и помнит.

    Это схоже с решением проблем провала частот на граничных участках на 6 и более децибел.

    Если решить проблему завала напрямую не выходит, просто расширяют диапазон усилителя, и тогда падение у него начинается не на 40Гц снизу и не на 16КГц сверху, а с 20Гц снизу и с 20КГц сверху при условии его собственного диапазона воспроизведения с 10Гц до 30КГц.

    И мы получаем снижение звукового давления выведенное за пределы слышимого диапазона.


    1. victor_1212
      10.10.2021 18:10
      +1

      >Вообще-то все не совсем так, точнее совсем не так.

      здесь вы прямо в точку попали, по всем делам связанным с усилителями, есть к примеру книжки douglas self, заметим что ухо тоже кодирует аудио сигнал для передачи в мозг, причем с существенными индивидуальными отличиями, которые типа калибруются уже серым веществом


      1. YMA
        10.10.2021 18:51
        +2

        Поддержу, и очень интересно было бы развить эту тему - "Чем мы слушаем?".

        Как я понимаю, ухо - не АЦП, который передает в мозг форму кривой давления воздуха на чувствительном элементе. Все эти 100500 чувствительных элементов, которые входят в резонанс с достигающим их звуком - передают в мозг скорее спектрограмму сигнала, с ограниченным разрешением по частоте и динамическим диапазоном.

        А значит - биты и килогерцы точности пропадают втуне, сначала теряясь на мембране динамика, потом в воздухе, а потом - на чувствительных элементах уха. Плюс еще и сами элементы уха зависимы друг от друга, при сильном возбуждении одних гасятся другие - что и позволило создать фраунгоферовцам психоакустическую модель и изобрести mpeg, который, выкидывая 90% сырых данных - создает нечто, слышимое практически как изначальный звук.

        Поэтому присоединюсь к сомневающимся в целесообразности 24бит/196кГц. Да, в любом случае большая точность не хуже, но вопрос в том, услышим ли мы это?

        PS: Идея для аудиофильской продукции - очиститель воздуха, который удаляет из него всю пыль, тем самым исключая интерференцию высоких частот на пылинках, и повышает "воздушность" звука.


        1. victor_1212
          11.10.2021 18:53

          вы понимаете правильно, человек воспринимает информацию в том числе звуковую интегрировано, типа своей обученной нейронной сетью, сегодня предположим ок, а через год с новым опытом и на новом материале не обязательно, поэтому такой раскардак с терминологией - тут тебе и теплое ламповое звучание, и глубокое, и 3х-мерная сцена, и пр., imho единственное о чем интересно говорить - звучание естественно или нет, причем всего тракта и на хорошо вам известном материале, типа знаете как конкретный голос или инструмент звучит реально и сравниваете,

          >присоединюсь к сомневающимся в целесообразности 24бит/196кГц.

          на мой взгляд все сложнее, сами по себе биты это далеко не все, но поскольку физически четких критериев таки нет, кто его знает, что там в сером веществе происходит, к примеру читаю review на сайте amir`а (что-то 24бит/196кГц) вижу результаты тестирования, цифры говорят - есть ли косяки или нет, не более, но на его личное субъективное мнение всегда внимание обращаю, таки человек много чего слышал, его нейронная сеть неплохо настроена вероятно, это тоже значение имеет, как обычно imho


  1. ALF_Zetas
    10.10.2021 19:50
    +1

    из какой древности высосана эта статья? - я 16-битных АЦП уже четверть века не встречал - даже у встроенной в материнку или смартфон звуковухе АЦП 24-битный


    1. JerleShannara
      11.10.2021 16:25
      +2

      Четверть века назад на материнке в лучшем случае было что-то типа Creative Vibra 16. Потом было AC97, которое умело в 48.0/16 и только потом пришло HDA, которое уже научилось в 24 бита (про кол-во значащих бит среди всех этих вариантов я лучше промолчу). Правда всё это обычно сопровождалось отвратительной разводкой (и схемотехникой) цепей аналогового питания и земли, что позволяло слушать перемещения мыши и работу жесткого диска, сначала в 2.0, а со временем и в полноценном 7.1 звуке.


      1. ALF_Zetas
        11.10.2021 21:02

        во первых четверть века тому запись звука для CD делали не на встроенных в материнку звуковухах, а на профессиональной аппаратуре. Впрочем на маковских материнках четверть тому стояли АЦП Burr-Brown вполне себе пригодные для проф. записи. Это потом фруктовая компания скатилась на банальные Реалтеки, а затем вообще на унылые энергосберегающие Циррусы с неотключаемыми "улучшайзерами". Ну и во вторых, упомянутые тобой звуки мыши указывают на то, что при оцифровке звука первоочередное значение имеет аналоговая часть, а вовсе не битность АЦП


        1. JerleShannara
          11.10.2021 21:42

          Пардоньте, изначально про «даже у встроенной в материнку» разговор, если чесать про запись в студиях, то это уже совершенно другое дело. А про аналоговую часть я всю дорогу и имею всем что сравнивать по «у меня тут 192/24, а твоя внешка такого не умеет» это клинический дибилизм, т.к. если засрать звук в самом начале, то далее его исправление превращается в весёленькое занятие (и попросту невозможно в нормальном виде).


  1. TitovVN1974
    10.10.2021 22:39

    На мой вкус, 16bit 44.1 LavryBlack DA10 звучал лучше чем SACD Maranz (на HD650)


  1. Refridgerator
    11.10.2021 06:15
    +2

    Для того, чтобы проверить на практике преимущества Hi-Res, все желающие могут провести любопытный тест — послушать в случайном порядке несколько записей с разной частотой дискретизации на хорошем цифровом аудиоплеере.
    Только для начала надо удостоверится, что у всех этих записей идентичный мастеринг — поскольку даже с обычным 44100 каждый новый релиз нестареющей классики студии ремастерят максимально агрессивно, чтобы разницу в звучании было хорошо слышно. И единственный путь для этого — получить Low-Res из Hi-Res качественным даун-семплингом, чтобы избежать наложения частот и искажения АЧХ/ФЧХ (внезапно, далеко не все топовые аудио-редакторы имеют качественную реализацию ресемплинга). Вот только после этого можно сравнивать, и вангую — на качественной аппаратуре вслепую никто не услышит разницы. А вот на некачественной — вполне может, если частоты выше 20кГц (уровень которых в hi-res довольно низкий) будут вносить катастрофические искажения в слышимый диапазон спектра.

    Можно пойти и другим путём — отфильтровать нижнюю часть спектра, оставив только высокие частоты, и для начала просто определить, включен плеер или нет. В случае, если вы их таки слышите (что на моей практике ни разу не встречалось) — можно задрать их уровень повыше и сделать для себя вывод самостоятельно — действительно ли вы хотите это слушать или там только грязь и шум. Для плеера foobar есть и подходящий плагин для этого (сорри что на гугл-диске, никак не могу соорудить сайт для своих поделок).


    1. omxela
      11.10.2021 13:19

      И единственный путь для этого — получить Low-Res из Hi-Res качественным даун-семплингом, чтобы избежать наложения частот и искажения АЧХ/ФЧХ... Вот только после этого можно сравнивать, и вангую — на качественной аппаратуре вслепую никто не услышит разницы.

      В точку, на мой взгляд. Я делал такие эксперименты, и не раз. Если звук хорош - я разницы не слышу. Старый, наверно, совсем стал.


  1. melodictsk
    11.10.2021 07:15

    А почему все забывают про фазу? На высоких частотах с фазой уже почти не проиграешь. А именно она и даёт эффект пространственного звучания. На 44100 на "тарелочках" уже с пространственным звуком не поиграть. 22кгц фаза звука может вообще принимать только 2 состояния. А нам надо его двигать вокруг. Так же верхние гармоники дают большие сдвиги фаз через интермодуляции. По итогу в моно выше крыши и CD, при объёмном звучании от хайрес толк есть. В играх это чуствуется.


    1. Refridgerator
      11.10.2021 07:40

      Никуда эта фаза не девается и не искажается — это раз, никто не способен определить фазу отдельно взятой частоты — это два, при сведении музыку стерео-панораму формируют амплитудой, а не фазой — это три, помещение фазовую картину искажает намного сильнее — это четыре, психоакустика в этом играет не последнюю роль — это пять.


  1. MikeVC
    11.10.2021 07:22

    У CD слабенькое разрешение по нынешним меркам. И вот почему:

    Да, теоретически позволяет частоты до 22к. Но для этой частоты остается всего 2 отсчета на полупериод. Синус 2мя отсчетами не воспроизвести. Возьмем 16кГц их слышат очень многие (я слышу громко и четко). На них приходится 2,7 отсчета! В результате, на частотах близких к теоретическому максимуму, имеем грязь, кучу гармоник. Каждый может взять осциллограф и посмотреть что там творится...

    Это же касается хорошего динамического диапазона когда в записи есть большая разница между громкими и тихими звуками. Тут не хватает 16 бит. На еле слышно пиликающую скрипочку приходится слишком мало бит.

    В итоге, для CD имеем агрессивный мастеринг. Звукорежиссер вынужден сжимать динамический диапазон чтобы хватило бит и придавливать верха по частоте чтобы там небыло грязи. Музыка становится ззжатой. На попсе этого не заметно а вот на сложных записях вроде рока или симфонии...

    На хай рез можно не зажимать музыку такой мастеринг сразу радикально выигрывает на хорошей апаратуре.


    1. Refridgerator
      11.10.2021 07:49
      +2

      Синус 2мя отсчетами не воспроизвести
      Прекрасно воспроизводится. Вы вообще в курсе, как апсемплинг в кратные частоты делается? Промежутки между отсчётами заполняются нулями, а затем фильтруются. Даже чисто механически эту фильтрацию можно производить — слышали о разрушенном резонансом мосте от проходящих по нему солдат строем?


      1. MikeVC
        11.10.2021 08:35
        -1

        Вкурсе про фильтрацию и все прочее. Недостаток разрешения это не компенсирует.


        1. Refridgerator
          11.10.2021 09:15
          +1

          Если ЦАП не в состоянии обеспечить адекватное преобразование — это проблема ЦАПа, а не разрешения источника данных. Есть конечно ситуации, когда 44.1/16 действительно может быть недостаточно — но это в случае оцифровки, чтобы был запас по ДД и частоте для последующей обработки.


          1. MikeVC
            11.10.2021 09:32

            Не только для последующей обработки. Это позволяет сделать полноценную запись в принципе, без "урезания" под формат CD или мп3. Советую послушать и все сразу станет ясно. Запись, изначально сделанную для хай-рез, а не сделанную для ширпотреба и в высоком разрешении. Во втором случае это будет все равно что смотреть DVD апскиленный до ФХД например.


            1. Refridgerator
              11.10.2021 09:55
              +2

              Проблема CD не в урезании, а в постобработке рипа и его шумоподавлении. Любительские винил-рипы звучат живее не потому, что это винил, а потому, что звук никто не портит «вычищением от грязи» — в то время как студии позволить себе не могут, потому как маркетинг. Особенно в начале эры CD, когда нужно было всеми неправдами показать, какой там чистый и кристальный звук. Мне как-то попадался рип Пинк Флойда с мастер-ленты — так так шум было невооружённым ухом слышно! Куда делся этот шум в издании на CD? Туда же, куда и нюансы звучания и полноценный ДД — отфильтровались и замаскировались.


              1. MikeVC
                11.10.2021 10:04

                Характерный признак записи, сделанной для ХД - громкость сразу надо прибавить в 2-3 раза. При этом уровень пиков - в норме! Просто сжатие динамического диапазона много меньше, чем в ширпотребных записях.

                К сожалению, ХД записей делают очень мало. Разный мастеринг делать дорого не все могут себе позволить. да и незачем.

                Ну а слушать в ХД обычный ширпотребный мастеринг нет смысла разницы будет очень мало или вобще никакой т.к все урезано...


  1. key08rus
    11.10.2021 08:01

    … благодаря более высокой плавности и слитности звучания в среднечастотном диапазоне, Hi-Res записи однозначно достойны внимания слушателей,

    ИМХО, тут основная причина лучшего звучания хайрез в том, что качественный постфильтр реализовать проще. Никакого оверсемплинга с интерполяцией, реализация ФНЧ — простая.
    Т.е. сделать хорошо звучащий ЦАП — проще.


  1. Almighty_Goose
    11.10.2021 22:59
    +1

    Я, честно говоря, вообще, не понимаю: в чем проблема в актовом зале или аудиостудии разместить 10-100 микрофонов с АЦП 32бит 1MSPS (Мегасэмпл-в-секунду) на каждый канал и потом даунскейлить в кодеком с достойной психоакустической моделью и приемлемое качество для клиента.

    Нелинейность микрофона к частотам компенсировать в оффлайне (привет, DSP!).

    Нужно вводить новые кодеки, которые будут иметь лучше модели и более приятный для уха звук, а не меряться килогерцами и килобитами или ламповостью усилительного тракта.