我已经看过很多关于这个主题的问题并且阅读了很多文章,但仍然无法找到最适合我所寻找的内容。 我想构建一个具有此功能的应用程序(Android / IOS / ...无论如何): 当用户写下一个文本(使用杀戮板)时,该应用程序可以识别他写的99.9%性能的语音到文本,我不介意他是否必须首先记录他的声音以使性能更好...我想要它是"生活"就像Google Servies不同于Seri,只有在你说完之后才会写文本。 我找到了这个网站: http://cmusphinx.sourceforge.net 我希望开始使用它,但在开始之前我想确保它是最好的方法。 任何人都可以提供一些建议吗? 谢谢 *编辑:如果需要,我不打算为新的launguage建立一个新的领域(不是英文)。
答案 0 :(得分:0)
我的意思是,如果你做一些研究,你会发现语音到文本的准确率只有99%,而Nuance的Dragon就是一个例子。
高准确度的语音转文本许可证的费用约为600美元。这不是一件容易的事情。您必须为高精度TTS库付费。
对于你正在做的事情,我使用的一项非常好的服务是Wit.ai。它非常准确,每周都会变得更快。
答案 1 :(得分:0)
另一种可能性是你在这里找到的AT& T语音引擎(Watson):http://developer.att.com/ 它们每月提供100万次API调用,费用(低),并允许您自定义用于识别语音的“库”。鉴于您的最新陈述,它可能是您正在寻找的。您可以免费试用它,但在您支付之前会受到限制。