我正在使用python语音识别,并且效果很好,但是无法解决这个问题。 问题:
这是我正在运行的简化代码,完全相同的问题:
import os
import speech_recognition as sr
recog = sr.Recognizer()
audioFile = sr.AudioFile('C:\\Users\ilieg\OneDrive\Documents\Sound recordings\male.wav')
transcript = ""
with audioFile as source:
audio = recog.listen(source)
transcript = transcript + " " + recog.recognize_google(audio)
print(transcript)
如果您需要音频文件的样本...我是从这里得到的,仅供测试:(我使用了第一个音频文件)
http://www.signalogic.com/index.pl?page=codec_samples
示例: 以下(click for audio file) 音频文件的输出为: 如果有人决定打破该计划,请注意保持足够的保险范围,但要寻找省钱的地方,宝贝,事情的平息比妻子时期的银行家期望的更长,否则公司可能会赢得她讨厌税收的退休收入提升有助于节省破布,而李将她的李扔在两条裸露的骨头上