java - Java语音识别

Java语音识别

时间：2009-03-04 07:11:49

标签： java linux speech-recognition

是否有任何人有使用任何开源资源或相对便宜的java语音识别API的经验？我几乎都在寻找能将口语转化为文字的东西。

从太阳上的java语音识别页面来看，它似乎已经相当死了。我的要求至少在linux上运行。

有人可以推荐一些东西吗？纯Java将是一个奖励，否则可以考虑基于Linux的解决方案。因为这是一个家庭项目......越便宜越好。

修改

CMU Sphinx 阿米特指出CMU Sphinx http://cmusphinx.sourceforge.net/html/cmusphinx.php 我的问题是大量的错误率。训练似乎本身就是一个项目，我希望本周末有一些力量去尝试。

IBM ViaVoice
2004年有关于Via Voice being made open source的新闻公告。似乎新闻发布还为时过早，而且从未发生过。 VIA Voice在某些时候是released for linux，但似乎他们停了下来。似乎留在IBM网站上的所有内容都是ViaVoice embedded。

IBM Websphere Voice
我想这就是为什么ViaVoice（桌面）似乎停止了。 IBM创建了这个商业解决方案，这个解决方案不仅仅需要分配一条腿和一条腿。只需使用它就可以使用你剩下的那些，至少在我使用websphere和他们的IDE之后。

Nuance的
看来他们仍然可以为linux创建产品。但我认为他们迷失了，并跟随IBM进入服务器市场。我对这一点并不确定，他们的网站在寻找有用信息方面并不友好。

Open Mind / Free Speech
这些家伙不断改变他们的项目名称。可能有些资金匮乏的公司一直在威胁他们，但我不知道。该项目看起来有点死。

我可能会在本周末尝试训练Sphinx，看看它是否想成为朋友。更糟糕的是，我会考虑使用微软的语音解决方案。它在过去对我有用，但它不是一个很棒的Linux解决方案。我可以通过葡萄酒使用它，但之后我会有两个独立的服务器......凌乱凌乱。

哦，对于语音/语音SpeechTechMag来说，这似乎是个好地方。他们有一个“年度参考”，其中包含一些公司名单，这些公司以某种方式将自己与语音/语音联系起来。

5 个答案:

答案 0 :(得分：9)

主要是Java：http://cmusphinx.sourceforge.net/html/cmusphinx.php

答案 1 :(得分：3)

如果你有预算，那么sphinx是目前最好的选择。但是它也会使你使用的模型与巨大的区别开来，你如何调整它们和如何调整你的音频源。绝对一切都必须匹配否则它不会工作。鉴于你所描述的问题，你愿意下注一笔可观的金额，你已经得到了你的模型混乱，你的麦克风没有正确校准。另外，如果你有口音它可能不会起作用 - 这不是解码器的问题，而是声学模型 - 如果训练数据中没有包含类似于你的声音/口音的人你会得到不好的结果

那说，你看过他们的开源模型页面了吗？

http://www.speech.cs.cmu.edu/sphinx/models/

根据您的尝试，您应该能够使用16kHz WSJ型号和千兆字符LMs NVP获得大约90％的言论自由度。但我要注意，ASR是一项艰巨的任务，尚未达到商品状态。

答案 2 :(得分：2)

您可以从http://www.basic-signalprocessing.com下载vPass（语音密码）。

对于（vText）语音到文本，我可以将vText.jar文件发送到您的电子邮件。请通知enquiry@basic-signalprocessing.com

这些组件是为Java和.Net语言设计的。识别期限为5秒。 VPass经过充分测试vText不是新的，这就是为什么还没有打包的原因。

的问候，安德烈亚斯

答案 3 :(得分：1)

我几天来一直在寻找同样的事情。到目前为止，我已经找到了Sphinx4和FreeTTS。两者都是java实现，而Sphinx似乎与FreeTTS不同，它经常更新。我遇到的唯一问题是Sphinx在办公环境中遇到了解我的问题，我需要一个仓库环境的解决方案。

答案 4 :(得分：1)

我的小组在Java中完成了一个迷你程序，使用Sphinx来识别口述数字。