我有两个问题:
1.有没有办法收听扬声器/系统声音并使用python进行打印(不必实时,更好)?
2.i编写了一个脚本,从音频文件中提取原始数据并通过模块打印出来:speech_recognition(使用python):
import speech_recognition as sp
audio_file = input("Enter audio file path: ")
print ("Listening...")
r = sp.Recognizer()
with sp.AudioFile(audio_file) as source:
audio = r.record(source)
command = r.recognize_google(audio)
print("result:")
print (command)
脚本运行良好并打印音频文件数据。另外,我想打印音频文件中所说的每个句子的开始时间和结束时间,例如:
00:00:00 - 00:02:00:“你好世界......”
00:04:00 - 00:06:00:“我的名字是Or Bar”
有没有办法获得每个句子的开始时间和结束时间?谢谢。