Если ваше хобби/DIY, как и моё, связано с компьютером, то на каком то этапе вам захочется использовать звук. Предлагаю поговорить о звуке и обменяться опытом. Конкретно говорить будем, про запись и воспроизведение звука на компьютере. Возьмем компьютер под управлением Linux, но и под Windows должно работать. Язык для программирования предпочитаю Python. Как известно в Linux есть ALSA и для нее есть python библиотека pyalsaaudio. В каком то проекте голосового помощника я видел ее использовали для регулировки громкости. Про громкость поговорим потом. Т.к. библиотека не является системонезависимой поэтому возьмем другую хорошо известную - sounddevice. Библиотека основано на кросс платформенной C/C++ библиотеке portaudio.
Необходимый минимум для использования sounddevice есть в описании и он весьма прост:
import sounddevice as sd
sd.play(myarray, fs)
здесь myarray — массив со звуком, надо сказать, что sounddevice поддерживает массивы numpy. fs — битрейт записи или частота дискретизации. Откуда это все брать? Нужна еще библиотека, например soundfile.
import sounddevice as sd
import soundfile as sf
myarray, fs = sf.read('my-file.wav')
sd.play(myarray, fs)
sd.wait() # ждем конца воспроизведения
Можно создать свой сигнал, например синус, таким образом для каких то нужд можно получить генератор любой звуковой частоты:
duration=1 длительность сигнала сек
frequency = 1000 # частота Гц
samplerate = 24000 # битрейт
amp = 10000 # амплитуда
#############
#берем numpy
import numpy as np
t = np.arange(duration * samplerate) / samplerate
signal = amp*np.sin(2 * np.pi * frequency * t)
sd.play(signal) sd.wait()
Естественно выбор не ограничен синусом. Не намного сложнее запись:
import sounddevice as sd
import soundfile as sf
fs = 48000 # битрейт записи
duration=3 # длительность записи
rec = sd.rec(int(duration * fs), samplerate=fs, channels=1, blocking=True)
sd.wait()
sf.write('my-file.wav', rec, fs)
Есть еще функция для одновременной записи и воспроизведя. Какие то подробности можно посмотреть в описании. Но это на мой взгляд мало интересно, т.к. недостаточно гибкости… Переходим к потокам. Про потоки в описании тоже ест и даже с примерами, поэтому отмечу, на мой взгляд, интересные моменты. Создаем поток:
stream = sd.Stream(device=(dev_in, dev_out),
samplerate=41000,
blocksize=blocksize,
dtype="int16",
channels=(1,2),
callback=callback_fun)
Данный тип потока поддерживает и запись и воспроизведение. В библиотеке есть и раздельные, но этот мне показался наиболее интересным. В параметре device, поэтому содержится указание на на эти устройства. Где же их брать? Воспользуемся функцией sd.query_devices():
device_info = sd.query_devices()
в результате получим список с доступными звуковыми устройствами. Например такой:
0 sof-hda-dsp: - (hw:0,0), ALSA (2 in, 0 out)
1 sof-hda-dsp: - (hw:0,3), ALSA (0 in, 2 out)
2 sof-hda-dsp: - (hw:0,4), ALSA (0 in, 2 out)
3 sof-hda-dsp: - (hw:0,5), ALSA (0 in, 2 out)
4 sof-hda-dsp: - (hw:0,6), ALSA (4 in, 0 out)
5 sof-hda-dsp: - (hw:0,7), ALSA (4 in, 0 out)
6 sysdefault, ALSA (128 in, 0 out)
7 samplerate, ALSA (128 in, 0 out)
8 speexrate, ALSA (128 in, 0 out)
9 pulse, ALSA (32 in, 32 out)
10 upmix, ALSA (8 in, 0 out)
11 vdownmix, ALSA (6 in, 0 out)
12 default, ALSA (32 in, 32 out)
в параметр device можно записать или номер или имя, например device = (12,12). Я пробовал в параметр вписать номер от микрофона USB камеры, программа работает через раз — вылетает ошибка с указанием на portaudio, как я понял такая ошибка не только у меня. C default все работает. Так можно получить имя устройства:
dev_in = sd.query_devices(kind="input")["name"]
dev_out = sd.query_devices(kind="output")["name"]
Для работы библиотека предлагает, и это удобно, использовать callback функцию.
def callback_fun(indata, outdata, frames, time, status):
if status:
print(status)
outdata[:] = indata
Она вызывается функцией потока. Здесь, в функции видно, что входной сигнал подается прямо на выход. Например сигнал с микрофона можно сразу услышать. Или если кто то делает голосового ассистента, то сигнал с микрофона надо направить на распознавание голоса, а сигнал с синтезатора голоса на выход. В этом случае удобно использовать очереди — queue. Для примера, как проиграть WAV фай с диска? Для этого можно использовать такие функции:
import queue
fifo = queue.Queue()
inp_fifo = queue.Queue()
#############
def play(file):
with sf.SoundFile(file,mode="r") as f:
data = f.read(blocksize,dtype='int16')
while len(data):
if not fifo.full():
data = f.read(blocksize,dtype='int16')
fifo.put(data)
#################
def callback_fun(indata, outdata, frames, time, status):
inp_fifo.put(bytes(indata.copy())) # для обработки сигнала с микрофона
if status:
print(status)
inp = np.zeros(len(outdata), dtype=np.int16)
if not fifo.empty() :
bf = np.frombuffer(fifo.get(), dtype=np.int16)
inp[:bf.shape[0]] = bf #
outdata[:] = inp.reshape(-1,1)
Отмечу, если помните, при создании потока был параметр channels=(1,2), который значит, что на вход у нас 1 — моно сигнал, а на выход 2 — стерео. Если вы подаете на выход моно сигнал в поток, то он автоматически разведется на два канала.
Пойдем далее. Возможно, что кто то уже догадался у нас массивы — вот он шанс сделать регулировку громкости, т. к. в sounddevice таких специальных функций нет.
Заводим переменную, например vol = 1, а далее магия циф в строке:
inp[:bf.shape[0]] = bf // vol
нам остается только правильно менять vol. Если взять vol = 1000, то можно практически
занулить звук. Можно пойти дальше… Если у нас есть, например, две входные очереди мы можем смешать звук от двух источников:
# см. В callback_fun
if not fifo1.empty() :
bf1 = np.frombuffer(fifo1.get(), dtype=np.int16)
inp1[:bf1.shape[0]] = bf1 #
if not fifo2.empty() :
bf2= np.frombuffer(fifo2.get(), dtype=np.int16)
inp2[:bf2.shape[0]] = bf2 #
inp = (inp1 + inp2)//2
outdata[:] = inp.reshape(-1,1)
Или один сигнал в левое уха, а другой в правое:
# см. В callback_fun
inp = np.column_stack((inp1,inp2))
outdata[:] = inp
На мой взгляд тут широкое поле для творчества. Если кто то захочет повторить мои эксперименты смотрите внимательно, я не профессиональный программист, могут быть ошибки. Ссылка на документацию sounddevice.
Надеюсь эта информация была полезна.
randomsimplenumber
Слабовато. Если это рассказ о DIY проекте - где проект? В Python есть библиотеки для работы со звуком, и это пересказ man'а - слабовато, правда.
Jury_78 Автор
Я ж предлагаю в начале - поделитесь, своим опытом- это пойдет на пользу. Я поделился своим.
Насчет man, я не понял :
man sounddevice
Нет справочной страницы для sounddevice
randomsimplenumber
В Python это называется help ;)
help (sounddevice)
Jury_78 Автор
Да, help есть, а
man sounddevice
нет ни в python, ни в Linux ;).