Question

我已经看过pyspeech和dragonfly的文档，但不知道如何输入要转换为文本的音频文件。我已经通过讲话来尝试使用麦克风并将语音转换为文本，但是如果我想输入以前录制的音频文件。任何人都可以帮忙举个例子吗？

Answer 1

PySpeech和Dragonfly都是SAPI相对较薄的包装器。不幸的是，它们都使用共享识别器，它不支持输入选择。虽然我对SAPI很熟悉，但我对Python并不熟悉，所以我无法帮助任何将PySpeech / Dragonfly转移到进程内识别器的人。

Answer 2

import speech_recognition as sr
print(sr.__version__)
r = sr.Recognizer()

audio_file = sr.AudioFile('audio_file.wav')

with audio_file as source:
   audio = r.record(source)

print(type(audio))
print(r.recognize_google(audio))

如何通过pyspeech或dragonfly输入和处理音频文件以转换为文本

2 个答案: