用例:我已将手机放在扬声器上,拨打客户服务,在我的笔记本电脑上录制自动语音留言,现在我想将其转换为文本。
到目前为止我做了什么?
我在python中尝试使用语音识别库
import speech_recognition as sr
import time
r=sr.Recognizer()
#This block will help in recognising audio file harvard = sr.AudioFile('voice1.wav') with harvard as source:
r.adjust_for_ambient_noise(source)
audio = r.record(source,offset=0, duration=5)
print r.recognize_google(audio, show_all=True)
但是,不会返回任何文字。
答案 0 :(得分:0)
对不起,您的回复很晚。 我使用Google Speech API创建了一个虚拟助手。事实证明,主要问题与麦克风阈值有关。尝试使用其阈值。。因为当您实时录制流时,请尝试将其保存并在本地收听。 麦克风功能中有一个参数是阈值,请尝试更改该参数,因为默认情况下,如果内置了麦克风,则将其变坏。
Google语音API可能被阻止了(但是即使我没有使用任何令牌,它也对我有用)。 尽管首选方法是在Google API中使用令牌(语音转换为文本) 当文本以完美的形式返回时。 检查语音识别的文档。还有很多其他API。