应用错误收集

Baby Cry声音检测

时间：2015-07-12 13:11:21

标签： audio fft

我想写一个代码来检测婴儿哭声。我使用Windows作为平台。目前，我能够获得音频样本及其频率图（使用FFT），但不知道如何继续前进。

我想问一下，考虑到它的时频图，我应该采取什么步骤来检测婴儿哭声。

我在语音识别中看到了一些方法，例如中值滤波器，然后是HMM。但是对于简单的声音检测，我是否需要采用这种sophiticated方法？

如果你能帮助我，我将非常感激。

1 个答案:

答案 0 :(得分：4)

隐藏的马尔可夫模型广泛用于语音识别，但由于你不需要知道你的宝宝在说什么（下一个项目：婴儿翻译），我不认为这是你需要的。

你应该做的是看很多婴儿的哭泣语，并寻找模式。或者，更好的是，让你的算法做到这一点。您所做的是计算有关您的声音MFCCs的某些指标你这样做，比如，1000个哭声样本，然后你有1000个指标向量。

现在，您可以针对每个指标计算标准偏差。这为您提供了一种方法来告诉随机babysound样本与 avarage哭声有多少不同。

这听起来很难，但我知道那里有工具。看看狮身人面像。你可以训练上班。

但不管怎样，从收集婴儿哭声开始;）（但不要偷糖果）

相关问题

C＃中的拍手声音检测

声频检测

Visual Basic - 声音检测

使用声音进行运动检测

Arduino nano，声音检测

网络声卡检测

拍手声音检测

Windows中的声音检测

Baby Cry声音检测

使用MFCC进行婴儿啼哭检测以及使用KNN分类器进行哭泣原因

最新问题

我写了这段代码，但我无法理解我的错误

我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？

是否有可能使 loadstring 不可能等于打印？卢阿

java中的random.expovariate()

Appscript 通过会议在 Google 日历中发送电子邮件和创建活动

为什么我的 Onclick 箭头功能在 React 中不起作用？

在此代码中是否有使用“this”的替代方法？

在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化

每千个数字得到

更新了城市边界 KML 文件的来源？