如何在Weka中解释逻辑回归的结果

时间:2018-08-17 09:33:46

标签: machine-learning classification weka logistic-regression

大家好,我是这个领域的新手,我想知道是否有人可以帮助我了解逻辑回归的结果。 我需要了解是否可以使用自变量进行良好的分类。

=== Run information ===

Scheme:       weka.classifiers.functions.Logistic -R 1.0E-8 -M -1 -num-decimal-places 4
Relation:     Train
Instances:    14185
Attributes:   5
              ATTR_1
              ATTR_2
              ATTR_3
              ATTR_4
              DEPENDENT_VAR
Test mode:    evaluate on training data

=== Classifier model (full training set) ===

Logistic Regression with ridge parameter of 1.0E-8
Coefficients...
               Class
Variable           0
====================
ATTR_1        0.0022
ATTR_2        0.0022
ATTR_3        0.0034
ATTR_4       -0.0021
Intercept     0.9156


Odds Ratios...
               Class
Variable           0
====================
ATTR_1        1.0022
ATTR_2        1.0022
ATTR_3        1.0034
ATTR_4        0.9979


Time taken to build model: 0.13 seconds

=== Evaluation on training set ===

Time taken to test model on training data: 0.07 seconds

=== Summary ===

Correctly Classified Instances       51240               72.2453 %
Incorrectly Classified Instances     19685               27.7547 %
Kappa statistic                         -0.0001
Mean absolute error                      0.3992
Root mean squared error                  0.4467
Relative absolute error                 99.5581 %
Root relative squared error             99.7727 %
Total Number of Instances            70925     

=== Detailed Accuracy By Class ===

                 TP Rate  FP Rate  Precision  Recall   F-Measure  MCC      ROC Area  PRC Area  Class
                 1,000    1,000    0,723      1,000    0,839      -0,005   0,545     0,759     0
                 0,000    0,000    0,000      0,000    0,000      -0,005   0,545     0,305     1
Weighted Avg.    0,722    0,723    0,522      0,722    0,606      -0,005   0,545     0,633     

=== Confusion Matrix ===

     a     b   <-- classified as
 51240     5 |     a = 0
 19680     0 |     b = 1

特别是,我对理解系数和比值比感兴趣。 谢谢。

1 个答案:

答案 0 :(得分:0)

我的头顶上

赔率与系数值成正比,并且可以相互计算。

对于attribute1,exp(0.0022) = 1.002

为了进行更多的计算和拟合/预测,系数“更好”。但是,系数是必须插入exp(x)函数中的值,并且很难“在您的头脑中可视化”。

为便于人类理解,优势比有时更方便-易于解释/可视化,但是您不能直接使用它们进行某些计算。

Weka不知道您对什么更感兴趣,因此为您和您带来方便。

顺便说一句,weka进行正规化逻辑回归 (Logistic Regression with ridge parameter of 1.0E-8),因此系数可能与其他软件包可能为您提供的系数略有不同。