使用python将自动录音转换为文本

时间:2018-06-07 06:42:10

标签: python speech-recognition pyaudio wave

用例:我已将手机放在扬声器上,拨打客户服务,在我的笔记本电脑上录制自动语音留言,现在我想将其转换为文本。

到目前为止我做了什么?

我在python中尝试使用语音识别库

import speech_recognition as sr 
import time 
r=sr.Recognizer()

#This block will help in recognising audio file harvard = sr.AudioFile('voice1.wav') with harvard as source:
    r.adjust_for_ambient_noise(source)
    audio = r.record(source,offset=0, duration=5)

print r.recognize_google(audio, show_all=True)

但是,不会返回任何文字。

1 个答案:

答案 0 :(得分:0)

对不起,您的回复很晚。 我使用Google Speech API创建了一个虚拟助手。事实证明,主要问题麦克风阈值有关。尝试使用其阈值。。因为当您实时录制流时,请尝试将其保存并在本地收听。 麦克风功能中有一个参数是阈值,请尝试更改该参数,因为默认情况下,如果内置了麦克风,则将其变坏。

Google语音API可能被阻止了(但是即使我没有使用任何令牌,它也对我有用)。 尽管首选方法是在Google API中使用令牌(语音转换为文本) 当文本以完美的形式返回时。 检查语音识别的文档。还有很多其他API。