我正在使用python在树莓派上玩声音输入和输出。 我的计划是读取麦克风的输入,操纵它并播放操纵的音频。目前我试图阅读和播放音频。 读取似乎有效,因为我在最后一步将读取数据写入波形文件,并且波形文件似乎很好。 但播放只是噪音。 播放波形文件也很有效,所以耳机很好。 我想也许我的设置或输出格式有问题。 代码:
import alsaaudio as audio
import time
import audioop
#Input & Output Settings
periodsize = 1024
audioformat = audio.PCM_FORMAT_FLOAT_LE
channels = 16
framerate=8000
#Input Device
inp = audio.PCM(audio.PCM_CAPTURE,audio.PCM_NONBLOCK,device='hw:1,0')
inp.setchannels(channels)
inp.setrate(framerate)
inp.setformat(audioformat)
inp.setperiodsize(periodsize)
#Output Device
out = audio.PCM(audio.PCM_PLAYBACK,device='hw:0,0')
out.setchannels(channels)
out.setrate(framerate)
out.setformat(audioformat)
out.setperiodsize(periodsize)
#Reading the Input
allData = bytearray()
count = 0
while True:
#reading the input into one long bytearray
l,data = inp.read()
for b in data:
allData.append(b)
#Just an ending condition
count += 1
if count == 4000:
break
time.sleep(.001)
#splitting the bytearray into period sized chunks
list1 = [allData[i:i+periodsize] for i in range(0, len(allData), periodsize)]
#Writing the output
for arr in list1:
# I tested writing the arr's to a wave file at this point
# and the wave file was fine
out.write(arr)
编辑:也许我应该提一下,我正在使用python 3
答案 0 :(得分:0)
我刚刚找到答案。 audioformat = audio.PCM_FORMAT_FLOAT_LE
这种格式不是我的耳机使用的格式(只是复制并粘贴它而不经过深思熟虑)。
通过在控制台中运行speaker-test
,我发现了我的麦克风格式(和其他信息)。
由于我的扬声器格式为 S16_LE ,因此代码可以正常使用audioformat = audio.PCM_FORMAT_S16_LE
答案 1 :(得分:0)
考虑至少使用plughw(支持重新采样/转换的alsa子系统)用于链的接收器部分:
#Output Device
out = audio.PCM(audio.PCM_PLAYBACK,device='plughw:0,0')
这应该有助于协商采样率和数据格式。
periodicize最好根据采样率的1 /次估算,如:
periodsize = framerate / 8
(8 = 8000 KHz采样率的次数)
并且睡眠时间最好估计为播放句号所需时间的一半:
sleeptime = 1.0 / 16
(1.0 - 是第二次,16 = 2 *次,8000 KHz采样率)