首先我读到这个:How to interpret weka classification? 但它并没有帮助我。
然后,为了设置背景,我正在尝试学习参与竞赛,并且模型将用ROC区域进行评估。
实际上我构建了两个模型,有关它们的数据以这种方式表示:
Correctly Classified Instances 10309 98.1249 %
Incorrectly Classified Instances 197 1.8751 %
Kappa statistic 0.7807
K&B Relative Info Score 278520.5065 %
K&B Information Score 827.3574 bits 0.0788 bits/instance
Class complexity | order 0 3117.1189 bits 0.2967 bits/instance
Class complexity | scheme 948.6802 bits 0.0903 bits/instance
Complexity improvement (Sf) 2168.4387 bits 0.2064 bits/instance
Mean absolute error 0.0465
Root mean squared error 0.1283
Relative absolute error 46.7589 % >72<69
Root relative squared error 57.5625 % >72<69
Total Number of Instances 10506
=== Detailed Accuracy By Class ===
TP Rate FP Rate Precision Recall F-Measure ROC Area Class
0.998 0.327 0.982 0.998 0.99 0.992 0
0.673 0.002 0.956 0.673 0.79 0.992 1
Weighted Avg. 0.981 0.31 0.981 0.981 0.98 0.992
除了K&amp; B相对信息得分;通过ROC曲线评估的相对绝对误差和根相对平方误差分别在最佳模型中较差,优越和优越, 所有数据都是一样的。 我建立了第三个具有类似行为的模型(TP率等),但同样是K&amp; B相对信息得分;相对绝对误差和Root相对平方误差变化。但这并不能预测这第三种模型是否优于两种模式(与最佳模型相比的差异,因此理论上它应该是优越的,但它不是)。
我应该做些什么来预测模型是否能够在有关它的详细信息的情况下表现良好?
先谢谢。