我需要开发一个程序,当它识别出鹦鹉尖叫声或尖叫声时,可以打开或关闭特定音轨。该软件需要识别特定范围的声音并允许范围内的一些变化(因为鹦鹉可能不会每次都完全复制其尖端声)。
示例:鸟尖叫,没有声音。鸟停止尖叫五秒钟,音轨赞美鸟儿戏剧。需要完全忽略定期聊天,因为不要气馁。
我听说过有内置词典的语音识别的java库,但需要教会我特定鹦鹉制作的特定声音 - 不是单词或任何随机鸟声。此外,正如我上面提到的,它需要允许声音的轻微变化,因为尖叫声可能永远不会与录制的版本100%相同。
最好的方法是什么?我应该研究哪种语言?
编辑:或者(也许这可能是一个更简单的解决方案),有没有办法根据输入量进行音频切换?所以鹦鹉会发出什么样的声音,这有多大声并不重要?