应用错误收集

使用已知字典的语音到文本的最佳算法是什么

时间：2015-05-12 17:53:33

标签： android ios speech-to-text

我已经看过很多关于这个主题的问题并且阅读了很多文章，但仍然无法找到最适合我所寻找的内容。我想构建一个具有此功能的应用程序（Android / IOS / ...无论如何）：当用户写下一个文本（使用杀戮板）时，该应用程序可以识别他写的99.9％性能的语音到文本，我不介意他是否必须首先记录他的声音以使性能更好...我想要它是＆＃34;生活＆＃34;就像Google Servies不同于Seri，只有在你说完之后才会写文本。我找到了这个网站： http://cmusphinx.sourceforge.net 我希望开始使用它，但在开始之前我想确保它是最好的方法。任何人都可以提供一些建议吗？谢谢 *编辑：如果需要，我不打算为新的launguage建立一个新的领域（不是英文）。

2 个答案:

答案 0 :(得分：0)

我的意思是，如果你做一些研究，你会发现语音到文本的准确率只有99％，而Nuance的Dragon就是一个例子。

高准确度的语音转文本许可证的费用约为600美元。这不是一件容易的事情。您必须为高精度TTS库付费。

对于你正在做的事情，我使用的一项非常好的服务是Wit.ai。它非常准确，每周都会变得更快。

答案 1 :(得分：0)

另一种可能性是你在这里找到的AT＆amp; T语音引擎（Watson）：http://developer.att.com/ 它们每月提供100万次API调用，费用（低），并允许您自定义用于识别语音的“库”。鉴于您的最新陈述，它可能是您正在寻找的。您可以免费试用它，但在您支付之前会受到限制。