我致力于语音识别。我用IOS框架解决了文本到语音和语音到文本的问题。但现在我想将保存的音频文件对话转换为文本。我怎么解决这个问题?感谢您的回复。
答案 0 :(得分:11)
我已经研究过同样适合我的事情。
我的项目包中有音频文件。所以我编写了以下代码来将音频转换为文本。
let audioURL = Bundle.main.url(forResource: "Song", withExtension: "mov")
let recognizer = SFSpeechRecognizer(locale: Locale(identifier: "en-US"))
let request = SFSpeechURLRecognitionRequest(url: audioURL!)
request.shouldReportPartialResults = true
if (recognizer?.isAvailable)! {
recognizer?.recognitionTask(with: request) { result, error in
guard error == nil else { print("Error: \(error!)"); return }
guard let result = result else { print("No result!"); return }
print(result.bestTranscription.formattedString)
}
} else {
print("Device doesn't support speech recognition")
}
首先从存储音频文件的位置获取音频网址。
然后使用您想要的语言环境创建SFSpeechRecognizer
的实例。
创建SFSpeechURLRecognitionRequest
的实例,用于请求recognitionTask
。
recognitionTask
会给你结果和错误。结果包含bestTranscription.formattedString
。 formmatedString
是您对音频文件的测试结果。
如果设置request.shouldReportPartialResults = true
,这将给出每行的部分音频结果。
我希望这会对你有所帮助。