我正在尝试将某些双语音频片段转换为文本。剪辑以英语开头,然后语言更改为Deutsch,然后再次更改为英语。
下面是我的代码:
import speech_recognition as sr
r = sr.Recognizer()
audio_file = sr.AudioFile('path_to_audio')
with audio_file as source:
audio_file_record = r.record(source)
print(r.recognize_google(audio_file_record, language='en-US'))
print(r.recognize_google(audio_file_record, language='de-DE'))
问题是第一个打印语句,仅在Deutsch之前打印英语音频部分,而不在Deutsch之后打印英语。
如何用两种语言的全文进行完整的片段转换?
我知道我可以设置offset
和duration
到达剪辑的特定部分,但是解决方案将特定于我不想要的剪辑。