神经网络模型通常的成功率是多少?

时间:2011-12-13 23:49:52

标签: neural-network

我正在建立一个NN训练分类的系统。

我对您构建的系统的错误率感兴趣吗?

来自UCI ML的经典示例是Iris数据集。 接受过NN训练的NN几乎是完美的 - 错误率为0-1%;但它是一个非常基本的数据集。

我的网络有以下结构:80英寸,208英里,2英尺。 我的结果是测试数据集的错误率为8%。

基本上在这个问题上我想询问你遇到的各种研究结果, 在你的工作,论文等。

增加1:   错误率当然是测试数据 - 而不是培训。所以它是网络的全新数据集

增加2(来自我在该问题下的评论): 我的新结果。 1200个条目,900个培训,300个测试。 Class1中的85,Class2中的1115。 85个,44个测试集。错误率 - 6%。它不是那么糟糕,因为44是300的约15%。所以我好2.5倍..

3 个答案:

答案 0 :(得分:1)

模型性能完全针对特定问题。即使在具有相似质量和开发数据量的情况下,具有相同的目标变量定义,性能也会有很大差异。显然,问题定义越相似,不同模型的性能就越有可能匹配。

要考虑的另一件事是技术性能业务性能之间的区别。在某些应用中,52%的准确度是非常有利可图的,而在其他领域,98%的准确度将无可救药地低。

答案 1 :(得分:1)

我还要补充一点,除了Predictor所提到的,测量你在训练集上的表现通常是无用的,作为确定分类器如何对以前看不见的数据执行的指南。很多时候使用相对简单的分类器,您可以在训练集上获得0%的错误率,而无需学习任何有用的东西(这称为过度拟合)。

更常用的(更有助于确定分类器的工作方式)是保持数据或交叉验证,如果将数据分成三部分,则更好:培训,验证和测试。

同样很难理解分类器在一个阈值上的效果如何,并且只给出真正的正面+真正的负面效果。人们倾向于评估假阳性和假阴性并绘制ROC曲线以查看/评估权衡。所以,说“好2.5倍”你应该清楚你的分类器将所有东西归类为C2,这是一个非常糟糕的基线。

答案 2 :(得分:0)

参见本文:

  

Danilo P. Mandic和Jonathon A. Chanbers(2000)。迈向最佳学习率   反向传播,神经处理信件11:1-5 PDF