我是Python的新手,我正在尝试训练我的音频语音识别模型。我想读取一个.wav文件,并将该.wav文件的输出输出到Numpy数组中。我该怎么办?
答案 0 :(得分:1)
与@Marco的评论保持一致,您可以查看Scipy库,尤其是scipy.io
。
from scipy.io import wavfile
要读取文件(“ filename.wav”),只需执行
output = wavfile.read('filename.wav')
这将输出一个元组(我将其命名为“输出”):
output[0]
,采样率output[1]
,您要分析的示例数组