Java语音识别

时间:2009-03-04 07:11:49

标签: java linux speech-recognition

是否有任何人有使用任何开源资源或相对便宜的java语音识别API的经验?我几乎都在寻找能将口语转化为文字的东西。

从太阳上的java语音识别页面来看,它似乎已经相当死了。我的要求至少在linux上运行。

有人可以推荐一些东西吗?纯Java将是一个奖励,否则可以考虑基于Linux的解决方案。因为这是一个家庭项目......越便宜越好。

  • 修改

CMU Sphinx 阿米特指出CMU Sphinx http://cmusphinx.sourceforge.net/html/cmusphinx.php 我的问题是大量的错误率。训练似乎本身就是一个项目,我希望本周末有一些力量去尝试。

IBM ViaVoice
2004年有关于Via Voice being made open source的新闻公告。似乎新闻发布还为时过早,而且从未发生过。 VIA Voice在某些时候是released for linux,但似乎他们停了下来。似乎留在IBM网站上的所有内容都是ViaVoice embedded

IBM Websphere Voice
我想这就是为什么ViaVoice(桌面)似乎停止了。 IBM创建了这个商业解决方案,这个解决方案不仅仅需要分配一条腿和一条腿。只需使用它就可以使用你剩下的那些,至少在我使用websphere和他们的IDE之后。

Nuance的
看来他们仍然可以为linux创建产品。但我认为他们迷失了,并跟随IBM进入服务器市场。我对这一点并不确定,他们的网站在寻找有用信息方面并不友好。

Open Mind / Free Speech
这些家伙不断改变他们的项目名称。可能有些资金匮乏的公司一直在威胁他们,但我不知道。该项目看起来有点死。

我可能会在本周末尝试训练Sphinx,看看它是否想成为朋友。更糟糕的是,我会考虑使用微软的语音解决方案。它在过去对我有用,但它不是一个很棒的Linux解决方案。我可以通过葡萄酒使用它,但之后我会有两个独立的服务器......凌乱凌乱。

哦,对于语音/语音SpeechTechMag来说,这似乎是个好地方。他们有一个“年度参考”,其中包含一些公司名单,这些公司以某种方式将自己与语音/语音联系起来。

5 个答案:

答案 0 :(得分:9)

答案 1 :(得分:3)

如果你有预算,那么sphinx是目前最好的选择。  但是它也会使你使用的模型与巨大的区别开来,你如何调整它们如何调整你的音频源。绝对一切都必须匹配否则它不会工作。鉴于你所描述的问题,你愿意下注一笔可观的金额,你已经得到了你的模型混乱,你的麦克风没有正确校准。另外,如果你有口音它可能不会起作用 - 这不是解码器的问题,而是声学模型 - 如果训练数据中没有包含类似于你的声音/口音的人你会得到不好的结果

那说,你看过他们的开源模型页面了吗?

http://www.speech.cs.cmu.edu/sphinx/models/

根据您的尝试,您应该能够使用16kHz WSJ型号和千兆字符LMs NVP获得大约90%的言论自由度。但我要注意,ASR是一项艰巨的任务,尚未达到商品状态。

答案 2 :(得分:2)

您可以从http://www.basic-signalprocessing.com下载vPass(语音密码)。

对于(vText)语音到文本,我可以将vText.jar文件发送到您的电子邮件。请通知enquiry@basic-signalprocessing.com

这些组件是为Java和.Net语言设计的。识别期限为5秒。 VPass经过充分测试vText不是新的,这就是为什么还没有打包的原因。

的问候, 安德烈亚斯

答案 3 :(得分:1)

我几天来一直在寻找同样的事情。到目前为止,我已经找到了Sphinx4和FreeTTS。两者都是java实现,而Sphinx似乎与FreeTTS不同,它经常更新。我遇到的唯一问题是Sphinx在办公环境中遇到了解我的问题,我需要一个仓库环境的解决方案。

答案 4 :(得分:1)

我的小组在Java中完成了一个迷你程序,使用Sphinx来识别口述数字。