我想写一个代码来检测婴儿哭声。我使用Windows作为平台。目前,我能够获得音频样本及其频率图(使用FFT),但不知道如何继续前进。
我想问一下,考虑到它的时频图,我应该采取什么步骤来检测婴儿哭声。
我在语音识别中看到了一些方法,例如中值滤波器,然后是HMM。但是对于简单的声音检测,我是否需要采用这种sophiticated方法?
如果你能帮助我,我将非常感激。
答案 0 :(得分:4)
隐藏的马尔可夫模型广泛用于语音识别,但由于你不需要知道你的宝宝在说什么(下一个项目:婴儿翻译),我不认为这是你需要的。
你应该做的是看很多婴儿的哭泣语,并寻找模式。或者,更好的是,让你的算法做到这一点。您所做的是计算有关您的声音MFCCs的某些指标 你这样做,比如,1000个哭声样本,然后你有1000个指标向量。
现在,您可以针对每个指标计算标准偏差。这为您提供了一种方法来告诉随机babysound样本与 avarage哭声有多少不同。
这听起来很难,但我知道那里有工具。看看狮身人面像。你可以训练上班。
但不管怎样,从收集婴儿哭声开始;)(但不要偷糖果)