Question

我致力于语音识别。我用IOS框架解决了文本到语音和语音到文本的问题。但现在我想将保存的音频文件对话转换为文本。我怎么解决这个问题？感谢您的回复。

Answer 1

我已经研究过同样适合我的事情。

我的项目包中有音频文件。所以我编写了以下代码来将音频转换为文本。

let audioURL = Bundle.main.url(forResource: "Song", withExtension: "mov")

let recognizer = SFSpeechRecognizer(locale: Locale(identifier: "en-US"))
let request = SFSpeechURLRecognitionRequest(url: audioURL!)

request.shouldReportPartialResults = true

if (recognizer?.isAvailable)! {

    recognizer?.recognitionTask(with: request) { result, error in
        guard error == nil else { print("Error: \(error!)"); return }
        guard let result = result else { print("No result!"); return }

        print(result.bestTranscription.formattedString)
    }
} else {
    print("Device doesn't support speech recognition")
}

首先从存储音频文件的位置获取音频网址。然后使用您想要的语言环境创建SFSpeechRecognizer的实例。创建SFSpeechURLRecognitionRequest的实例，用于请求recognitionTask。

recognitionTask会给你结果和错误。结果包含bestTranscription.formattedString。 formmatedString是您对音频文件的测试结果。

如果设置request.shouldReportPartialResults = true，这将给出每行的部分音频结果。

我希望这会对你有所帮助。

Swift - 如何将Saved Audio文件对话转换为Text？

1 个答案: