使用java将音频文件转换为文本文件

时间:2012-03-05 15:29:11

标签: java speech-recognition speech-to-text

我正在使用java开发桌面应用程序。这个应用程序是为学校的孩子教英语,用户可以上传一些英语音频可以是任何格式,需要转换成文本文件。他们可以在哪里阅读文字。

我找到了一些api,但我不确定。

http://cmusphinx.sourceforge.net/wiki/

我在stackoverflow上看到很多关于这个的问题,但没有一个是有帮助的。如果有人可以提供帮助,那将是非常好的

谢谢

2 个答案:

答案 0 :(得分:3)

您所寻求的是目前的突破性技术。像cmusphinx这样的工具可以检测来自专用的有限词典的单词(所以你可以教它理解,比方说,15个单词就是这样 - 你不能教它理解英语)。

基本上,这些工具会尝试在您提供的声波中找到模式。他们什么都不懂,他们只是对任何东西使用相同的算法,然后尝试找到最接近的匹配。这适用于少量单词,但随着单词数量的增加,之间的差异缩小,工作变得更加困难(甚至没有像是天气还是天气或C看到的那样开始)。

您可能会考虑的是“在我之后重复”软件。在这里,您需要将测试的所有单词记录为模板。然后你可以记录瞳孔中的单词然后计算差异。如果差异不是太大,那么这个词是正确的。但同样:这是改善发音的简单重复 - 而不是英语。

有桌面软件可以理解很多英语(例如来自Nuance的产品,Dragon Naturally Speaking是最着名的产品之一)。他们确实提供服务器解决方案,但如果预算紧张,该软件不是免费的或便宜的。

答案 1 :(得分:3)

有许多技术和服务可用于执行语音识别。有关某些选项的介绍,请参阅https://stackoverflow.com/a/6351055/90236

我不确定结果是否可以接受将儿童英语作为第二语言教学,但值得尝试。