azure - 如何提高Azure语音到文本API的准确性？

在过去的几周里，我一直在尝试为巴西葡萄牙语找到一个不错的语音转文本API。我曾尝试使用Google Cloud，Amazon，IBM和Microsoft，但没有一个结果能像this app一样准确。这个程序支持多种语言，甚至标点符号！我不认为开发人员已经为其提供的20多种语言训练了模型。虽然我不知道这个人使用的是哪种api（我给他发送了电子邮件，但尚未收到任何回复），但我已经开始使用Azure CognitveServices Speech Api，通过我的测试，该API数量最多准确的一个。但是，我仍然对收到的抄本不满意。有没有办法提高准确性？我的目标是录制不同种类的音频：采访，演讲等。它不会总是同一位发言人或同一环境。即使输入文件的性质不同，还是值得训练我自己的模型吗？

欢迎任何提示。

我一直在使用this code

提前谢谢！

如何提高Azure语音到文本API的准确性？

0 个答案: