machine-learning - 在声音识别中进行异常值检测的方法？

有两种方法可以解决这个问题：作为分类问题，以及异常检测问题。

<强>分类

作为分类问题，可能会引入系统应用程序中可能遇到的外部声音，并使用它来创建第三类。对于这个第三类来说，拥有大量的声音很重要，而且可能有很多声音。

有了这个，你可能想要使用成本敏感的一个对所有，所以调整精度/召回来挑选出A和B类。

此方法的好处是您不必为异常值/异常模型设置任意阈值。在这种情况下，距离可能很难衡量，因此找到合适的阈值可能很困难。

许多人，包括我自己在类似于你的问题的讨价还价比赛中使用了这种技术。 https://www.kaggle.com/c/axa-driver-telematics-analysis

离群值/异常检测

由于您使用的是神经网络，因此可以构建自动编码器。这将发现一组声音，代表您试图检测的声音。您可以使用重建损失作为异常检测的距离度量。这仍然需要您确定阈值，最好使用一些现有的异常/异常数据来执行此操作。