唱歌时连续语音识别?

时间:2011-08-23 13:20:41

标签: java speech-recognition cmusphinx

作为我的应用程序的一部分,我希望添加语音识别,但不是传统意义上的。我有一堆由某人演唱的歌词(分为经文),其目的是找到当前正在演唱的诗歌,以便在屏幕上显示。

我玩过sphinx并得到一些基本的例子设置和工作,但是虽然似乎有大量关于注册语音文本的文档,你可以等待延迟然后处理结果,我不能找到了不断识别句子的想法。这当然是在我到达那些正在唱歌而没有说出来的部分之前!

有没有人有过这方面的经验,如果有,那么任何地方都可以提供一个良好的起点?或者是我正在努力实现与狮身人面像过于雄心勃勃的事情,它是否真的无法正常运作?我愿意看其他图书馆,但他们必须是免费的,而且狮身人面像是最广泛谈论的我可以挖掘的。

1 个答案:

答案 0 :(得分:3)

只要发出一点延迟,就能很快识别出语音。此外,如果你或多或少了解你期望得到什么。这称为“部分结果”,可通过API在所有CMUSphinx解码器中使用。基本上你可以在过程中检索假设。

关于如何稳定此结果(如何提取其稳定部分)需要考虑一些问题,但这种技术称为回溯并且可以轻松实现

对于唱歌,鉴于音乐可以被滤除,它也是可行的。