我的项目是使用麦克风进行说话人识别。
我正在使用speeh_recognition库来提取我的麦克风音频,但该对象的类是“speech_recognition.AudioData”'并且我不知道如何将其转换为wav文件(例如,为了使用librosa获取音频功能并可能识别扬声器)。
有人可以帮我吗?我已经学习Python的时间不长,因此可能还有更简单的方法来使用麦克风进行说话人识别:) 非常感谢!
答案 0 :(得分:2)
将音频写入WAV文件:
with open("microphone-results.wav", "wb") as f:
f.write(audio.get_wav_data())
引用doc:
返回表示WAV文件内容的字节字符串 包含由AudioData实例表示的音频。