WEKA投票算法分类与概率不一致?

时间:2015-06-02 10:26:15

标签: java machine-learning weka

我的问题是使用WEKA Vote命令使用平均概率和以下分类器:

  1. SMO
  2. MultilayerPerceptron
  3. J48
  4. java -classpath weka.jar -Xmx1G weka.classifiers.meta.Vote -S 1 -p 0 -distribution -t train.arff -T test.arff -B "weka.classifiers.functions.SMO -C 1.0 -L 0.001 -P 1.0E-12 -N 0 -V -1 -W 1 -M -K \"weka.classifiers.functions.supportVector.PolyKernel -C 250007 -E 1.0\"" -B "weka.classifiers.functions.MultilayerPerceptron -L 0.3 -M 0.2 -N 500 -V 0 -S 0 -E 20 -H a" -B "weka.classifiers.trees.J48 -C 0.25 -M 2" -R AVG

    Weka结果输出:

    inst#     actual  predicted error distribution
     1        1:?   1:active       *0.311,0.689 
     2        1:?   1:active       *0.807,0.193 
     3        1:?   1:active       *0.187,0.813
    

    我对实例1和3被归类为“有效”的原因感到有点困惑,当根据分布时,替代“非活动”具有更高的概率。

    例如,如果第1行是一致的,我会想象它的结果会是这样的:

     1        1:?   2:inactive       0.311,*0.689
    

    非常感谢任何解释或指示。

1 个答案:

答案 0 :(得分:0)

事实证明,解决方案是升级我的WEKA版本。我之前使用的是3.5.6版本,升级到3.7.2对我来说很有用。

我收到的结果现在正如预期的那样:

 inst#     actual  predicted error distribution
 1        1:? 2:inactive       0.311,*0.689 
 2        1:?   1:active       *0.807,0.193 
 3        1:? 2:inactive       0.187,*0.813