我已经对该代码进行了编程,可以将音频转换为文本。它不会转换整个文本。音频的总持续时间为1.21分钟。但是该程序仅从音频中输出4个单词,其余的音频对话丢失了。有人可以帮我解决这个问题。下面是代码。
import speech_recognition as sr
from gtts import gTTS
import os
import playsound
r = sr.Recognizer()
with sr.AudioFile('Track1.wav') as source:
r.adjust_for_ambient_noise(source, duration=0.5)
audio = r.listen(source)
try:
text = (r.recognize_google(audio, language="en-US"))
print('working on...')
print(text)
except:
print('Sorry.. run again..')
答案 0 :(得分:1)
尝试其他音频文件。如果您对其他音频文件也只说了几句话,则可能是对Speech_recognition库中的ognize_google函数使用的“免费”默认Google API密钥的限制。在这种情况下,您将需要自己的API密钥来转录更长的音频文件。