Question

我正在使用python在树莓派上玩声音输入和输出。我的计划是读取麦克风的输入，操纵它并播放操纵的音频。目前我试图阅读和播放音频。读取似乎有效，因为我在最后一步将读取数据写入波形文件，并且波形文件似乎很好。但播放只是噪音。播放波形文件也很有效，所以耳机很好。我想也许我的设置或输出格式有问题。代码：

import alsaaudio as audio
import time
import audioop


#Input & Output Settings
periodsize = 1024
audioformat = audio.PCM_FORMAT_FLOAT_LE
channels = 16
framerate=8000

#Input Device
inp = audio.PCM(audio.PCM_CAPTURE,audio.PCM_NONBLOCK,device='hw:1,0')
inp.setchannels(channels)
inp.setrate(framerate)
inp.setformat(audioformat)
inp.setperiodsize(periodsize)

#Output Device
out = audio.PCM(audio.PCM_PLAYBACK,device='hw:0,0')
out.setchannels(channels)
out.setrate(framerate)
out.setformat(audioformat)
out.setperiodsize(periodsize)


#Reading the Input
allData = bytearray()
count = 0
while True:
    #reading the input into one long bytearray
    l,data = inp.read()
    for b in data:
        allData.append(b)

    #Just an ending condition
    count += 1
    if count == 4000:
        break

    time.sleep(.001)


#splitting the bytearray into period sized chunks
list1 = [allData[i:i+periodsize] for i in range(0, len(allData), periodsize)]

#Writing the output
for arr in list1:
    # I tested writing the arr's to a wave file at this point
    # and the wave file was fine
    out.write(arr)

编辑：也许我应该提一下，我正在使用python 3

Answer 1

我刚刚找到答案。 audioformat = audio.PCM_FORMAT_FLOAT_LE这种格式不是我的耳机使用的格式（只是复制并粘贴它而不经过深思熟虑）。通过在控制台中运行speaker-test，我发现了我的麦克风格式（和其他信息）。

由于我的扬声器格式为 S16_LE ，因此代码可以正常使用audioformat = audio.PCM_FORMAT_S16_LE

Answer 2

考虑至少使用plughw（支持重新采样/转换的alsa子系统）用于链的接收器部分：

#Output Device out = audio.PCM(audio.PCM_PLAYBACK,device='plughw:0,0')

这应该有助于协商采样率和数据格式。

periodicize最好根据采样率的1 /次估算，如：

periodsize = framerate / 8（8 = 8000 KHz采样率的次数）

并且睡眠时间最好估计为播放句号所需时间的一半：

sleeptime = 1.0 / 16（1.0 - 是第二次，16 = 2 *次，8000 KHz采样率）

Alsaaudio录制和播放

2 个答案: