我编写了一个脚本,从音频文件中提取原始数据并通过模块打印出来:speech_recognition(使用python):
import speech_recognition as sp
audio_file = input("Enter audio file path: ")
print ("Listening...")
r = sp.Recognizer()
with sp.AudioFile(audio_file) as source:
audio = r.record(source)
command = r.recognize_google(audio)
print("result:",command)
脚本运行良好并打印音频文件数据。另外,我想打印音频文件中所说的每个句子的开始时间和结束时间,例如:
00:00:00 - 00:02:00:“你好世界......”
00:04:00 - 00:06:00:“我的名字是Or Bar”
有没有办法获得每个句子的开始时间和结束时间?我真的需要它为我做的项目,谢谢。