应用错误收集

时间：2012-03-05 15:29:11

标签： java speech-recognition speech-to-text

我正在使用java开发桌面应用程序。这个应用程序是为学校的孩子教英语，用户可以上传一些英语音频可以是任何格式，需要转换成文本文件。他们可以在哪里阅读文字。

我找到了一些api，但我不确定。

我在stackoverflow上看到很多关于这个的问题，但没有一个是有帮助的。如果有人可以提供帮助，那将是非常好的

谢谢

答案 0 :(得分：3)

您所寻求的是目前的突破性技术。像cmusphinx这样的工具可以检测来自专用的有限词典的单词（所以你可以教它理解，比方说，15个单词就是这样 - 你不能教它理解英语）。

基本上，这些工具会尝试在您提供的声波中找到模式。他们什么都不懂，他们只是对任何东西使用相同的算法，然后尝试找到最接近的匹配。这适用于少量单词，但随着单词数量的增加，之间的差异缩小，工作变得更加困难（甚至没有像是天气还是天气或C看到的那样开始）。

您可能会考虑的是“在我之后重复”软件。在这里，您需要将测试的所有单词记录为模板。然后你可以记录瞳孔中的单词然后计算差异。如果差异不是太大，那么这个词是正确的。但同样：这是改善发音的简单重复 - 而不是英语。

有桌面软件可以理解很多英语（例如来自Nuance的产品，Dragon Naturally Speaking是最着名的产品之一）。他们确实提供服务器解决方案，但如果预算紧张，该软件不是免费的或便宜的。

答案 1 :(得分：3)

有许多技术和服务可用于执行语音识别。有关某些选项的介绍，请参阅https://stackoverflow.com/a/6351055/90236。

我不确定结果是否可以接受将儿童英语作为第二语言教学，但值得尝试。