如何提高Azure语音到文本API的准确性?

时间:2020-01-21 18:10:00

标签: azure speech-to-text

在过去的几周里,我一直在尝试为巴西葡萄牙语找到一个不错的语音转文本API。我曾尝试使用Google Cloud,Amazon,IBM和Microsoft,但没有一个结果能像this app一样准确。这个程序支持多种语言,甚至标点符号!我不认为开发人员已经为其提供的20多种语言训练了模型。虽然我不知道这个人使用的是哪种api(我给他发送了电子邮件,但尚未收到任何回复),但我已经开始使用Azure CognitveServices Speech Api,通过我的测试,该API数量最多准确的一个。但是,我仍然对收到的抄本不满意。有没有办法提高准确性?我的目标是录制不同种类的音频:采访,演讲等。它不会总是同一位发言人或同一环境。即使输入文件的性质不同,还是值得训练我自己的模型吗?

欢迎任何提示。

我一直在使用this code

提前谢谢!

0 个答案:

没有答案