WEKA分类结果相似但性能不同

时间:2015-05-27 12:20:55

标签: machine-learning weka roc

首先我读到这个:How to interpret weka classification? 但它并没有帮助我。

然后,为了设置背景,我正在尝试学习参与竞赛,并且模型将用ROC区域进行评估。

实际上我构建了两个模型,有关它们的数据以这种方式表示:

Correctly Classified Instances       10309               98.1249 %
Incorrectly Classified Instances       197                1.8751 %
Kappa statistic                          0.7807
K&B Relative Info Score             278520.5065 % 
K&B Information Score                  827.3574 bits      0.0788 bits/instance 
Class complexity | order 0            3117.1189 bits      0.2967 bits/instance 
Class complexity | scheme              948.6802 bits      0.0903 bits/instance  
Complexity improvement     (Sf)       2168.4387 bits      0.2064 bits/instance 
Mean absolute error                      0.0465 
Root mean squared error                  0.1283 
Relative absolute error                 46.7589 % >72<69
Root relative squared error             57.5625 % >72<69
Total Number of Instances            10506     

=== Detailed Accuracy By Class ===

           TP Rate   FP Rate   Precision   Recall  F-Measure   ROC Area  Class
             0.998     0.327      0.982     0.998     0.99       0.992    0
             0.673     0.002      0.956     0.673     0.79       0.992    1
Weighted Avg.    0.981     0.31       0.981     0.981     0.98       0.992

除了K&amp; B相对信息得分;通过ROC曲线评估的相对绝对误差和根相对平方误差分别在最佳模型中较差,优越和优越, 所有数据都是一样的。 我建立了第三个具有类似行为的模型(TP率等),但同样是K&amp; B相对信息得分;相对绝对误差和Root相对平方误差变化。但这并不能预测这第三种模型是否优于两种模式(与最佳模型相比的差异,因此理论上它应该是优越的,但它不是)。

我应该做些什么来预测模型是否能够在有关它的详细信息的情况下表现良好?

先谢谢。

0 个答案:

没有答案