Question

我已经对该代码进行了编程，可以将音频转换为文本。它不会转换整个文本。音频的总持续时间为1.21分钟。但是该程序仅从音频中输出4个单词，其余的音频对话丢失了。有人可以帮我解决这个问题。下面是代码。

import speech_recognition as sr
from gtts import gTTS
import os
import playsound

r = sr.Recognizer()

with sr.AudioFile('Track1.wav') as source:
    r.adjust_for_ambient_noise(source, duration=0.5)
    audio = r.listen(source)
    try:
        text = (r.recognize_google(audio, language="en-US"))
        print('working on...')
        print(text)
    except:
        print('Sorry.. run again..')

Answer 1

尝试其他音频文件。如果您对其他音频文件也只说了几句话，则可能是对Speech_recognition库中的ognize_google函数使用的“免费”默认Google API密钥的限制。在这种情况下，您将需要自己的API密钥来转录更长的音频文件。

语音识别到文字的语音不适用于python

1 个答案: