应用错误收集

时间：2011-08-23 13:20:41

标签： java speech-recognition cmusphinx

作为我的应用程序的一部分，我希望添加语音识别，但不是传统意义上的。我有一堆由某人演唱的歌词（分为经文），其目的是找到当前正在演唱的诗歌，以便在屏幕上显示。

我玩过sphinx并得到一些基本的例子设置和工作，但是虽然似乎有大量关于注册语音文本的文档，你可以等待延迟然后处理结果，我不能找到了不断识别句子的想法。这当然是在我到达那些正在唱歌而没有说出来的部分之前！

有没有人有过这方面的经验，如果有，那么任何地方都可以提供一个良好的起点？或者是我正在努力实现与狮身人面像过于雄心勃勃的事情，它是否真的无法正常运作？我愿意看其他图书馆，但他们必须是免费的，而且狮身人面像是最广泛谈论的我可以挖掘的。

答案 0 :(得分：3)

只要发出一点延迟，就能很快识别出语音。此外，如果你或多或少了解你期望得到什么。这称为“部分结果”，可通过API在所有CMUSphinx解码器中使用。基本上你可以在过程中检索假设。

关于如何稳定此结果（如何提取其稳定部分）需要考虑一些问题，但这种技术称为回溯并且可以轻松实现

对于唱歌，鉴于音乐可以被滤除，它也是可行的。