我已经看过pyspeech和dragonfly的文档,但不知道如何输入要转换为文本的音频文件。我已经通过讲话来尝试使用麦克风并将语音转换为文本,但是如果我想输入以前录制的音频文件。任何人都可以帮忙举个例子吗?
答案 0 :(得分:0)
PySpeech和Dragonfly都是SAPI相对较薄的包装器。不幸的是,它们都使用共享识别器,它不支持输入选择。虽然我对SAPI很熟悉,但我对Python并不熟悉,所以我无法帮助任何将PySpeech / Dragonfly转移到进程内识别器的人。
答案 1 :(得分:0)
import speech_recognition as sr
print(sr.__version__)
r = sr.Recognizer()
audio_file = sr.AudioFile('audio_file.wav')
with audio_file as source:
audio = r.record(source)
print(type(audio))
print(r.recognize_google(audio))