WEKA加权平均问号

时间:2020-05-11 08:49:06

标签: weka

根据以下WEKA的输出,一些加权平均有值,但另一个有问号。对于TP率,加权平均。即使在STM_TAUM_KRTN行上有两个问号,也将计算该值。但是,它不是针对Precision,F-Measure和MCC计算的。

=== Detailed Accuracy By Class ===

                 TP Rate  FP Rate  Precision  Recall   F-Measure  MCC      ROC Area  PRC Area  Class
                 0.714    0.000    1.000      0.714    0.833      0.845    1.000     1.000     MEA0072
                 0.818    0.001    0.818      0.818    0.818      0.817    0.999     0.913     MEA0095
                 0.885    0.001    0.958      0.885    0.920      0.920    1.000     0.983     MEA1061
                 1.000    0.001    0.981      1.000    0.990      0.990    1.000     0.999     MEA2087
                 0.846    0.001    0.846      0.846    0.846      0.845    1.000     0.965     MEA2098
                 0.938    0.001    0.938      0.938    0.938      0.937    1.000     0.968     MEA2099
                 0.971    0.001    0.943      0.971    0.957      0.956    0.999     0.973     MEB0079
                 0.917    0.000    1.000      0.917    0.957      0.957    1.000     1.000     MEE0075
                 1.000    0.001    0.967      1.000    0.983      0.983    1.000     1.000     MFT0001
                 0.930    0.001    0.976      0.930    0.952      0.952    0.999     0.967     MFT0002
                 1.000    0.000    1.000      1.000    1.000      1.000    1.000     1.000     MFT0003
                 1.000    0.000    1.000      1.000    1.000      1.000    1.000     1.000     MFT1001
                 0.944    0.002    0.850      0.944    0.895      0.895    1.000     0.986     MFT1002
                 1.000    0.000    1.000      1.000    1.000      1.000    1.000     1.000     MFT1003
                 1.000    0.001    0.975      1.000    0.987      0.987    1.000     0.999     MFT2001
                 1.000    0.000    1.000      1.000    1.000      1.000    1.000     1.000     MRA1002
                 1.000    0.000    1.000      1.000    1.000      1.000    1.000     1.000     MRA2125
                 1.000    0.001    0.984      1.000    0.992      0.992    1.000     1.000     MRA2127
                 ?        0.000    ?          ?        ?          ?        ?         ?         STM_TA
                 0.786    0.051    0.793      0.786    0.790      0.737    0.948     0.818     STM_TL
                 0.547    0.106    0.553      0.547    0.550      0.443    0.848     0.588     STM_TT
                 0.000    0.000    ?          0.000    ?          ?        0.894     0.064     STM_X
                 0.547    0.008    0.806      0.547    0.652      0.649    0.978     0.762     UM_KK
                 0.864    0.082    0.787      0.864    0.824      0.760    0.941     0.815     UM_KRK
                 ?        0.000    ?          ?        ?          ?        ?         ?         UM_KRTN
Weighted Avg.    0.797    0.053    ?          0.797    ?          ?        0.943     0.816     

=== Confusion Matrix ===

   a   b   c   d   e   f   g   h   i   j   k   l   m   n   o   p   q   r   s   t   u   v   w   x   y   <-- classified as
   5   0   0   0   0   0   0   0   1   0   0   0   0   0   0   0   0   1   0   0   0   0   0   0   0 |   a = MEA0072
   0   9   0   0   1   1   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0 |   b = MEA0095
   0   0  23   0   0   0   0   0   0   0   0   0   3   0   0   0   0   0   0   0   0   0   0   0   0 |   c = MEA1061
   0   0   0  51   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0 |   d = MEA2087
   0   2   0   0  11   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0 |   e = MEA2098
   0   0   0   0   1  15   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0 |   f = MEA2099
   0   0   0   0   0   0  33   0   0   1   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0 |   g = MEB0079
   0   0   0   0   0   0   0  11   0   0   0   0   0   0   1   0   0   0   0   0   0   0   0   0   0 |   h = MEE0075
   0   0   0   0   0   0   0   0  29   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0 |   i = MFT0001
   0   0   0   1   0   0   2   0   0  40   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0 |   j = MFT0002
   0   0   0   0   0   0   0   0   0   0  23   0   0   0   0   0   0   0   0   0   0   0   0   0   0 |   k = MFT0003
   0   0   0   0   0   0   0   0   0   0   0  45   0   0   0   0   0   0   0   0   0   0   0   0   0 |   l = MFT1001
   0   0   1   0   0   0   0   0   0   0   0   0  17   0   0   0   0   0   0   0   0   0   0   0   0 |   m = MFT1002
   0   0   0   0   0   0   0   0   0   0   0   0   0  16   0   0   0   0   0   0   0   0   0   0   0 |   n = MFT1003
   0   0   0   0   0   0   0   0   0   0   0   0   0   0  39   0   0   0   0   0   0   0   0   0   0 |   o = MFT2001
   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0  55   0   0   0   0   0   0   0   0   0 |   p = MRA1002
   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0  58   0   0   0   0   0   0   0   0 |   q = MRA2125
   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0  61   0   0   0   0   0   0   0 |   r = MRA2127
   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0 |   s = STM_TA
   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0 302  70   0   2  10   0 |   t = STM_TL
   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0  51 204   0  12 106   0 |   u = STM_TT
   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   7   0   0   1   0 |   v = STM_X
   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   3  45   0  58   0   0 |   w = UM_KK
   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0  25  43   0   0 433   0 |   x = UM_KRK
   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0 |   y = UM_KRTN


我已经在互联网上进行搜索,但是“加权平均值”中的问号没有答案。我希望有人能帮助我解释为什么其中一些是经过计算的而不是其他人吗?

谢谢

2 个答案:

答案 0 :(得分:1)

“?”由于分母为零,因此在Weka中使用NaN(不是数字)而不是NaN。例如。在您的情况下,类STM_X的精度为“?”,因为没有实例分配给该类,因此分母为零。此外,STM_TA和UM_KRTN根本没有样本。

何时'?'符号出现在输出中,则特定的类别可能没有足够的样本,或者没有样本可以分配给该类别。在您的情况下,两个类别根本没有样本,因此为所有指标提供了“?”。在所示的情况下,尽管TP,FP,Recall,ROC和PRC的加权平均值都具有价值,但其栏中有“?”。 请注意,对于FP以外的所有度量,STM_TA和UM_KRTN类均具有“?”(因为由于完全没有样本,因此没有误报),因此列中的“?”可以仅为0,并且可以计算加权平均值。但是,对于STM_X,有8个样本,但没有一个样本可以正确分配给类别,因此无法计算NaN或“?”以及加权平均值。

答案 1 :(得分:0)

? (未确定)值正在传播。请注意,在上面的行中,您还有一些值也是?。请注意,您有一些没有分类实例的类。