识别“叮咚”的声音

时间:2015-12-16 06:06:01

标签: audio machine-learning pattern-recognition audio-processing

我正在建立声音识别模型以检测“叮咚”的声音。

有两个程序,培训和测试。

训练数据是设备生成的“叮咚”声音。

该型号可以检测同一设备产生的“叮咚”声音,效果很好。

但是,当第二个设备产生新的“叮咚”声时,性能会很差。

我知道这个问题的可能解决方案:记录第二个设备生成的“叮咚”声音并将其添加到训练数据中。

但是,总有一种新设备,新的“叮咚”声。

我该怎么办?

2 个答案:

答案 0 :(得分:2)

你正面临着过度拟合的问题。过度拟合意味着您的模型已经过训练,可以针对作为训练数据集的特定情况进行最佳工作。为了克服这个问题,您应该在许多设备上训练您的模型,然后在它们之间进行插值。您正在使用的模型可以保证插值。

但是,之前的信息非常普遍。在您的情况下,您可能会发现更容易的方法。一切都取决于你如何定义"叮咚"。如果你能为'叮咚"找到一个siguntur?这会很棒。此签名应对所有不良特征不变。

例如,应该" Diiiiing-doooooong"被接受?如果是的话,你应该找到一个对长度音频剪辑不变的签名。是"叮咚"更高的频率可以接受?如果是的话,你应该找到一个签名,它将频率视为彼此的分数而不是绝对值等等......

顺便说一句,我相信你可以谷歌这个并找到很多关于你的问题的论文,但它可能是关于"当洞"不是"叮咚"但你仍然可以从中受益;)

答案 1 :(得分:1)

所以你想要识别"叮咚声音"来自"其他声音"。

一种方法可以是训练数据以识别"其他声音"作为另一个班级。因此,一个新的叮咚可以更容易地与叮咚声音相关联。而不是"其他 - 声音"。

这种方法的一个缺点可能是错误警报数量的增加,但这项任务总是导致精确度和召回之间的妥协。