使用神经网络在1000中找到1颗宝石?别的什么?

时间:2012-02-25 06:34:20

标签: audio signal-processing neural-network classification

我不了解神经网络。我试图将它们用于财务数据分析和音频音调分类。在这两种情况下,我都需要一个可以从众多中检测重要项目的分类器。对于每千次负面点击,我的音频应用程序确实有一个积极的打击。我运行网络培训师,它得知这是一个非常好的猜测,只是去消极。还有其他一些检测稀有宝石的算法吗?是否有某种形式的神经网络训练特别适合这类问题?我可以将我的正数据的范围更改为等于负值的总和,但我不明白它是如何与典型神经网络中0到1的首选范围相符合的。

1 个答案:

答案 0 :(得分:1)

以下是两个可能的建议:

  1. 平衡训练集

    即使真实世界数据包含的积极数为负数的1000倍,您的训练数据也不必如此。您可以修改训练数据集以增加训练集中的正数比例。这将改善召回(更多真实的积极因素),但也会恶化精确度(也更多的误报)。因此,您必须在训练集中尝试理想的负数与负数的比例。

    本文更详细地讨论了这种方法:http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2243711/pdf/procamiasymp00003-0260.pdf

  2. 异常检测

    ......另一方面,如果你用一个更平衡的训练集培训神经网络的正面例子太少,那么也许你可以尝试anomaly detection。通过异常检测,您可以训练算法(例如,神经网络)以识别负数据点的外观。然后,任何看起来与正常不同的数据点都会被标记为正数。