Картинка Freepik

Достаточно много времени назад мне пришла в голову такая странная мысль — а что, если звук записывать на бумагу?

Мне это показалось любопытным, и я стал исследовать этот вопрос, найдя целый ряд решений, самое старое из которых насчитывает чуть меньше века (что не делает его менее интересным). И вы можете попробовать повторить найденные решения самостоятельно, а также попробовать собственные силы в разработке своего решения вопроса, вынесенного в заголовок.

Я полагаю, что после прочтения этого вступления самые нетерпеливые скажут «пффф!» и запостят в комментариях фото музыкальных нот :-) Но не спешите, я имел в виду не интерпретацию записи человеком и её воспроизведение также человеком, а некий машинный способ записи звука на бумагу, с последующим прямым воспроизведением с бумаги, также машинным способом.

Но, перед тем как собирать что-то своё, надо ознакомиться с историей вопроса, что может существенно помочь в своих собственных разработках, дав обзорное видение и избавив от «изобретения велосипедов».

История звукозаписи насчитывает более века, и первая запись звука была осуществлена в 1878 году (но опыты по этому направлению проводились ещё ранее), когда перед собравшимися учёными патентного ведомства Томас Эдисон продемонстрировал первый звукозаписывающий аппарат — фонограф:

Картинка: В. Д. Охотников — «В мире застывших звуков»

Во время демонстрации учёные мужи напряжённо вслушивались в звуки, издаваемые из рупора, в то время как человек крутил ручку, а из рупора звучал слабый дребезжащий голос.

Аппарат был устроен таким образом, что неподвижно закреплённый рупор оканчивался мембраной, на которой была укреплена игла, упирающаяся в бороздки переменной глубины, процарапанные на цилиндре, который и вращался с помощью рукоятки.

Вращение барабана с бороздками вызывало вибрации иглы, которые передавались на мембрану, вибрирующую со звуковой частотой и излучающей звук, который и усиливался рупором.

Запись производилась таким же образом, только наоборот: вставлялся чистый цилиндр, его вращали рукояткой, в то время как кто-то говорил в рупор. Звук, проходя по рупору, заставлял вибрировать мембрану, а связанная с ней игла процарапывала в цилиндре бороздки переменной глубины.

Послушать, как звучит фонограф, можно в видео ниже, где с 4:10 показана запись барабана, а с 4:30 можно посмотреть воспроизведение:

А вот так звучала самая первая запись на фонограф, 1860 года:

Если первая версия аппарата представляла собой барабан, обёрнутый оловянным листом, то дальнейшие, более продвинутые версии, представляли собой барабан, покрытый воском. Это было гораздо удобнее, так как после прослушивания записи можно было соскоблить восковой слой, нанести его заново и записать новую запись.

Гораздо позже, уже с 1940 годов, этот принцип был ещё раз усовершенствован, и колебания иглы преобразовывались уже в электрический сигнал, который мог уже быть передан на расстояние, и там расшифровывался, преобразовываясь в колебания громкоговорителя (но это были уже не фонографы, об этом — ниже).

Устройство произвело фурор и стало распространяться, а для него стали продавать записанные барабаны. Но тут же выявилась и проблема: запись каждого нового барабана отнимала столько же времени, как и запись предыдущего, то есть технология была недоработанной и, образно говоря, была ничуть не лучше, чем рукописное переписывание книг, в Средние века.

Поэтому инженерная мысль шла дальше, и у фонографа вскоре появился конкурент — граммофон.

Работал он на таких же принципах, но был гораздо удобнее, так как запись производилась на плоский диск, а плоские диски было удобно хранить:

Картинка: В. Д. Охотников — «В мире застывших звуков»

Кроме того, плоские диски было очень удобно тиражировать — для этого всего лишь достаточно было изготовить матрицу, отлить туда пластичную массу и с помощью пресса вдавить туда массу. Это и предопределило дальнейшее распространение граммофона и его окончательную победу над фонографом.

И вот, мы подходим к самому интересному — появлению звука в кино. До первой половины двадцатых годов фильмы показывались в кинотеатрах без звука, и кинематограф того периода так и называли — Великий Немой.

Но, понятное дело, людей это не устраивало, и шли разработки способа добавить звук в фильмы. Изначально для этого использовался самый логичный, но курьёзно звучащий в наше время способ: в местах, где производился показ фильма, вместе с фильмом ездила группа актёров, которые, прячась за ширмой, произносили свои реплики синхронно тому, что происходило на экране.

В дальнейшем была разработана технология записи звука на грампластинку, которая воспроизводилась синхронно с фильмом.

Но это всё было не то, так как технологии того периода позволяли записать звук только в пределах примерно трёх минут, и поэтому разработки продолжались…

В конце концов, это привело к прорывному на тот момент решению: а что, если фотографировать звук?!

Эта идея и привела к созданию следующего устройства:

Картинка: В. Д. Охотников — «В мире застывших звуков»

Как можно видеть на картинке выше, маленькое зеркальце было укреплено на мембране, которой заканчивался рупор.

На это зеркальце светил луч света от источника и колебался вместе с мембраной, когда кто-либо говорил в рупор.

Колебания лучика света были направлены на постоянно перематывающуюся киноплёнку, и на киноплёнке возникал рисунок звуковой волны.

Таким образом, после проявки киноплёнки стандартным способом она содержала не только кадры для просмотра, но и звуковую дорожку.

Теперь, если перемотать киноплёнку и направить на то место, где проходит звуковая дорожка, луч света, а с противоположной стороны киноплёнки поставить фотоэлемент — то прозрачные и тёмные участки звуковой дорожки будут по-разному заслонять свет. Фотоэлемент, на который попадает такой мерцающий свет, будет генерировать электрический ток с такой же частотой, каким был и звук при записи этой дорожки. Таким образом, можно получить практически полную копию оригинального звука.

В дальнейшем этот подход распространился и усовершенствовался, дав нам всем радость звукового кино. А первая запись и воспроизведение звука таким способом была произведена в 1927 году.

Тем не менее инженерная мысль продолжала двигаться дальше, и в 1931 году Б. П. Скворцов разработал любопытный аппарат, названный им «говорящая бумага», где запись и воспроизведение звука производились на обычной бумажной ленте, что позволяло существенно удешевить хранение звука (так как бумага существенно дешевле любой киноплёнки). Кроме того, тиражирование таких записей было также весьма лёгким и могло быть осуществлено с помощью обычной типографии или даже просто вручную, с помощью копирования через стекло.

Воспроизведение звука с помощью этого аппарата производилось без какого-либо контакта считывающего устройства с бумагой, с помощью оптического датчика, что существенно удлиняло срок службы бумаги (до 10 000 воспроизведений, без какой-либо потери качества звучания — по сохранившейся информации).

Доработка технологии длилась порядка 10 лет, и первая версия серийного аппарата увидела свет только в 1941 году, под названием «установка УГБ»:

image

image
Картинки: back-in-ussr.com

Установки такого типа представляли собой как средство считывания звуковой дорожки, так и усилитель с громкоговорителем.

Печать звуковой дорожки на бумажной ленте производилась типографским литографическим способом, после чего напечатанная, чёрного цвета, звуковая дорожка протягивалась перед объективом, за которым был установлен фотоэлемент.

На саму ленту прямо под объективом направлялся луч света, который частично поглощался чёрным цветом звуковой дорожки, и частично отражался пробельными участками. Всё это приводило к мерцанию света на фотоэлементе, и, после усиления сигнала от фотоэлемента — к воспроизведению звука громкоговорителем.

На бумажную ленту обычно наносили восемь параллельных дорожек, при этом одна звуковая дорожка шла в одну сторону, другая — в другую и т. д.

Это давало возможность домотать рулон до конца, прослушивая одну дорожку, после чего начать его перематывать в другую сторону, переключившись на прослушивание другой дорожки.

Технология обеспечивала непрерывное прослушивание звука в течение порядка 40 минут, притом что средняя грампластинка на тот момент могла воспроизводить звук продолжительностью не более 5 минут!

Сохранилась запись тех времён, где вы сами можете послушать, как звучит такая «говорящая бумага»:

А запись таких звуковых дорожек, помимо печати типографском способом, могла быть произведена непосредственно с микрофона: колебания мембраны микрофона усиливались и передавались на электромагнит, который колебал перо с чёрными чернилами, рисующее синусоиду на бумаге.

Тем не менее начавшаяся война и эвакуация завода по производству аппаратов положила конец распространению звукозаписи на бумаге…

Теперь, после того как мы немножко погрузились в предысторию и узнали, как в прошлом реализовывали запись звука на бумаге, мы можем прикинуть, как мы могли бы осуществить это в наше время…

Так как способ довольно простой, то и вариантов решения этой задачи существует множество. Разумеется, самый простой вариант — повторить «1 в 1» (понятно, на новой элементной базе, так как строить на лампах это всё сейчас не стоит). Исходя из современных возможностей, я бы, в свою очередь, предложил следующий вариант решения этого вопроса: на базе инфракрасного датчика препятствий TCRT5000, имеющего аналоговый выход (на картинке помечен как А0):

image
Картинка: aliexpress.ru

Датчик содержит как излучатель инфракрасного света, так и его приёмник. При появлении препятствия, чем оно ближе к датчику — тем сильнее от него начинает отражаться инфракрасный луч, что, соответственно, плавно изменяет напряжение на аналоговом выходе датчика (0-5 вольт). Такой подход частенько используют в самодельных робототехнических конструкциях для измерения расстояния до препятствия.

Тем не менее, в нашем случае, это может быть использовано следующим образом, немножко нестандартно: если прямо под этим датчиком протягивать бумажную ленту с напечатанной чёрной звуковой дорожкой — это будет приводить к колебаниям напряжения на аналоговом выходе. Почему: экспериментально мной было выявлено, что у такого датчика инфракрасный луч очень плохо отражается от чёрных поверхностей (в зависимости от того, какая поверхность, т.е. насколько глубокий чёрный цвет).

Например, достаточно покрасить бумагу чёрным перманентным маркером (или даже просто запечатать на чёрно-белом лазерном принтере), чтобы луч от неё перестал отражаться! А от всех других цветов луч будет отражаться по-разному, в зависимости от цвета. Но, в любом случае, от белого цвета будет отражаться очень хорошо.

Для того чтобы подстроить датчик под то, чтобы луч не отражался от конкретно вашего чёрного цвета и отражался от белой бумаги — на датчике есть потенциометр, вращая который можно добиться нужной степени чувствительности датчика.

Теперь останется только подключить этот аналоговый выход к какому-либо усилителю, например, к усилителю на одном транзисторе, к которому подключается звуковая колонка — и в теории мы вполне можем иметь «бумажный звук».

Запись можно попробовать реализовать обратным способом: микрофон подключается к такому же усилителю на одном транзисторе, на выход которого вешается электромагнитная катушка с фломастером на якоре, который и чертит синусоиду на протягиваемой под фломастером ленте.

Или же можно поступить ещё проще: загрузить звуковой трек в любой звуковой редактор, например, тот же самый Sound Forge и распечатать получившуюся синусоиду на бумаге (сделав принтскрин с экрана).

Но это всё относительно старые технологии. А что насчёт современных подходов? В ходе поисков мне удалось найти только один довольно интересный проект (да, мало кто разрабатывает такие темы) — запись звука с помощью qr-кодов:

Как можно видеть, выглядит впечатляюще и звучит так же!

А теперь, некоторые подробности о проекте. Перед этим стоит упомянуть, что проект интересен не только своим нестандартным подходом, но и тем, что в сети доступны все исходники проекта и вы можете попробовать повторить его самостоятельно!

Итак, что он собой представляет:

  • битрейт звукового потока составляет до 16 kbps (почему «до»: у него в видео выше говорится о 12 kbps, а в техническом описании — 16 kbps. Поэтому поставил тут «до» — в качестве условного ориентира). Несмотря на условно малый битрейт — звучание хорошее, за это стоит благодарить формат кодирования Opus а также использование переменного битрейта: на тихих участках битрейт меньше, а на богатых звуками — больше). Это позволило получить во время экспериментов итоговый файл весом всего в 355 Кб — для звукового файла длиной в 4:21 мин.,
  • звук закодирован в qr-кодах самого большого размера согласно спецификации — 177х177 модулей,
  • скорость перематывания qr-кодов составляет 1-2 в секунду,
  • перемотка осуществляется с помощью шагового двигателя и Arduino,
  • звуковой файл разбивается на равные части, а самый последний qr-код дополняется нулями в той части, где не хватает данных,
  • на выходе было получено 157 qr-кодов (для указанного выше звукового фрагмента в 4:21 мин. длиной),
  • файлы были распечатаны на обычном лазерном принтере,
  • считывание qr-кодов производилось с помощью веб-камеры Logitech C920,
  • воспроизведение файлов производится сразу, без записи на жёсткий диск, только в оперативной памяти происходит небольшая буферизация,
  • подробное описание проекта и исходники можно найти здесь и здесь.

Сам автор отмечает, что он не считает свой проект оптимальным, и теоретически информация вполне может быть закодирована более оптимальным способом (по мнению автора).

Кроме того, пропускная способность этой системы несколько снижена из-за больших пробелов между отдельными qr-кодами.

Подытоживая, можно сказать, что оптическое кодирование звука является достаточно увлекательным занятием, последнее слово в области DIY ещё не сказано ;-)

Таким образом, вы можете как повторить описанные выше подходы, так и попробовать разработать свой собственный. Потому что, например, мне бросается в глаза, что не хватает ещё одного подхода, который был бы весьма интересен, а может быть, даже имел некоторую коммерческую перспективу:

  • никаких движущихся частей: ничего не перематывается и не крутится,
  • камера смартфона фотографирует статичное изображение, в котором хранится вся нужная для воспроизведения информация о треке,
  • происходит воспроизведение полученной звуковой оптической информации. Камеры смартфона достаточно для получения всей необходимой информации (способ кодирования информации должен укладываться в возможности средней стандартной, на текущий момент, камеры смартфона).

Кстати говоря, частным случаем описанного выше гипотетического варианта может быть всё же вращающаяся грампластинка — только на новой технологической базе: печатаем на белой бумаге чёрные звуковые дорожки в виде спирали, крутим шаговым двигателем, читаем оптическим датчиком. Вроде та же старая пластинка, да не та же: ибо стильный технологичный современный аппарат. Вполне может потянуть на роль арт-объекта :-) Или забавной самоделки, которую можно собрать совместно с детьми. Как альтернатива — сделать бумажную макро-копию (по принципу работы) компакт-диска (или что-то наподобие).

Итак, энтузиасты — ваш выход! ;-) Как бы вы реализовали подобное (описанное в пунктах чуть выше, где без вращений и движений)? А может быть, в ходе прочтения вам пришёл в голову какой-то свой, собственный подход? Будет интересно почитать в комментариях!

В любом случае повторить классический вариант «говорящей бумаги», только на современной элементной базе, достаточно просто, и каждый может испытать свои силы в этом!

Telegram-канал со скидками, розыгрышами призов и новостями IT ?

Комментарии (13)


  1. zezic
    25.07.2024 13:19
    +3

    Ещё можно вот так: https://warmplace.ru/soft/phonopaper/


    1. Wizard_of_light
      25.07.2024 13:19
      +2

      Вот, тоже хотел написать, что фонопэйпер забыли. Он ещё и в режиме озвучивания произвольных картинок работает, и забавные звуки при этом издаёт :)


  1. OldFisher
    25.07.2024 13:19

    Видимо, наиболее экономичным способом будет спектрограмма. Наверное, с логарифмической шкалой частоты. Если попытаться уместить это на лист, то можно заполнить его параллельными полосами, а в разделителях между полосами будет синхросигнал для привязки ко времени.


  1. iliasam
    25.07.2024 13:19
    +2

    А есть еще это: https://habr.com/ru/articles/66004/

    Заявлено, что на лист А4 можно 0.5Мб загнать.
    Если использовать кодек Speex, 8кГц/16-бит, то битрейт закодированных данных будет 1000байт/с. Получается, что на страницу влезет 500с записи, т.е. больше 8 минут звука.


    1. dlinyj
      25.07.2024 13:19
      +3

      Заявлено, что на лист А4 можно 0.5Мб загнать.

      Так на пачке бумаги целый фильм может уместится


  1. carx
    25.07.2024 13:19

    Или же можно поступить ещё проще: загрузить звуковой трек в любой звуковой редактор, например, тот же самый Sound Forge и распечатать получившуюся синусоиду на бумаге (сделав принтскрин с экрана).

    Во-первых, не синусоида, во-вторых только очень короткий фрагмент


    1. mmarch777
      25.07.2024 13:19
      +1

      https://www.youtube.com/watch?v=lfZ6XSRaRR8


  1. 19Zb84
    25.07.2024 13:19
    +1

    Есть такая пограмма, которая переводи картинки в звук )
    https://photosounder.com/

    https://youtu.be/aIjXp2KwW8U


  1. engin
    25.07.2024 13:19

    Или я отстал от науки или это моя интуиция говорит об обратном, что-то мне подсказывает, что наравне с софтом распознавания сканированного текста с преобразованием его в голосовую озвучку, существует софт для сканирования с распознаванием нот и преобразованием их в живое звучание. Таким образом вроде как само собой напрашивающееся решение.


    1. Nikita22007
      25.07.2024 13:19

      можно в 2 этапа: сосканировать в midi, а потом midi превротить в mp3/wav. Сам таким занимался


  1. GeorgeTudosi
    25.07.2024 13:19
    +1

    Звук — это еще ладно...


  1. ahabreader
    25.07.2024 13:19

    Несмотря на условно малый битрейт — звучание хорошее, за это стоит благодарить формат кодирования Opus

    Ну, на этих битрейтах (~12 kbps)... я бы его сначала поблагодарил за свободность, а потом за качество среди свободных форматов. Чудеса творит его конкурент - xHE-AAC, но энкодер exhale ниже 64kbps не опускается и остаётся только проприетарный фраунгоферовский из EZ CD Audio Converter.


  1. Vad55
    25.07.2024 13:19

    Добавлю к вариантам забивания гвоздей микроскопом.

    Как только увидел оптический датчик для ардуино, сразу пришла идея сделать тележку на ардуино с тремя датчиками, которая будет ездить по трассе и проигрывать мелодию. Два датчика будут удерживать тележку на дорожке а третий посредине считывать "музыкальную дорожку" и воспроизводить звук. То есть, не бумага будет двигаться, а воспроизводящее устройство по бумаге ! ))

    На современном уровне электроники и полиграфии, это вообще не проблема.

    Дальше-больше. Если поставить на тележку более мощный девайс с фотокамерой, то вместо "звуковой дорожки" для фотоэлемента, можно использовать штрихкоды или QR коды.

    ... а если, вместо тележки использовать квадрокоптер... ну вы поняли... )))