建议创建自定义声音识别软件以切换音频

时间:2011-03-08 08:07:17

标签: audio voice-recognition

我需要开发一个程序,当它识别出鹦鹉尖叫声或尖叫声时,可以打开或关闭特定音轨。该软件需要识别特定范围的声音并允许范围内的一些变化(因为鹦鹉可能不会每次都完全复制其尖端声)。

示例:鸟尖叫,没有声音。鸟停止尖叫五秒钟,音轨赞美鸟儿戏剧。需要完全忽略定期聊天,因为不要气馁。

我听说过有内置词典的语音识别的java库,但需要教会我特定鹦鹉制作的特定声音 - 不是单词或任何随机鸟声。此外,正如我上面提到的,它需要允许声音的轻微变化,因为尖叫声可能永远不会与录制的版本100%相同。

最好的方法是什么?我应该研究哪种语言?

编辑:或者(也许这可能是一个更简单的解决方案),有没有办法根据输入量进行音频切换?所以鹦鹉会发出什么样的声音,这有多大声并不重要?

1 个答案:

答案 0 :(得分:0)

这个问题似乎与语音识别密切相关。我建议你看一下这篇文章:How to convert human voice into digital format?