Question

我的项目是使用麦克风进行说话人识别。

我正在使用speeh_recognition库来提取我的麦克风音频，但该对象的类是“speech_recognition.AudioData”＆＃39;并且我不知道如何将其转换为wav文件（例如，为了使用librosa获取音频功能并可能识别扬声器）。

有人可以帮我吗？我已经学习Python的时间不长，因此可能还有更简单的方法来使用麦克风进行说话人识别:) 非常感谢！

Answer 1

将音频写入WAV文件：

with open("microphone-results.wav", "wb") as f:
    f.write(audio.get_wav_data())

引用doc：

返回表示WAV文件内容的字节字符串包含由AudioData实例表示的音频。