大家好,我是这个领域的新手,我想知道是否有人可以帮助我了解逻辑回归的结果。 我需要了解是否可以使用自变量进行良好的分类。
=== Run information ===
Scheme: weka.classifiers.functions.Logistic -R 1.0E-8 -M -1 -num-decimal-places 4
Relation: Train
Instances: 14185
Attributes: 5
ATTR_1
ATTR_2
ATTR_3
ATTR_4
DEPENDENT_VAR
Test mode: evaluate on training data
=== Classifier model (full training set) ===
Logistic Regression with ridge parameter of 1.0E-8
Coefficients...
Class
Variable 0
====================
ATTR_1 0.0022
ATTR_2 0.0022
ATTR_3 0.0034
ATTR_4 -0.0021
Intercept 0.9156
Odds Ratios...
Class
Variable 0
====================
ATTR_1 1.0022
ATTR_2 1.0022
ATTR_3 1.0034
ATTR_4 0.9979
Time taken to build model: 0.13 seconds
=== Evaluation on training set ===
Time taken to test model on training data: 0.07 seconds
=== Summary ===
Correctly Classified Instances 51240 72.2453 %
Incorrectly Classified Instances 19685 27.7547 %
Kappa statistic -0.0001
Mean absolute error 0.3992
Root mean squared error 0.4467
Relative absolute error 99.5581 %
Root relative squared error 99.7727 %
Total Number of Instances 70925
=== Detailed Accuracy By Class ===
TP Rate FP Rate Precision Recall F-Measure MCC ROC Area PRC Area Class
1,000 1,000 0,723 1,000 0,839 -0,005 0,545 0,759 0
0,000 0,000 0,000 0,000 0,000 -0,005 0,545 0,305 1
Weighted Avg. 0,722 0,723 0,522 0,722 0,606 -0,005 0,545 0,633
=== Confusion Matrix ===
a b <-- classified as
51240 5 | a = 0
19680 0 | b = 1
特别是,我对理解系数和比值比感兴趣。 谢谢。
答案 0 :(得分:0)
我的头顶上
赔率与系数值成正比,并且可以相互计算。对于attribute1,exp(0.0022) = 1.002
为了进行更多的计算和拟合/预测,系数“更好”。但是,系数是必须插入exp(x)
函数中的值,并且很难“在您的头脑中可视化”。
为便于人类理解,优势比有时更方便-易于解释/可视化,但是您不能直接使用它们进行某些计算。
Weka不知道您对什么更感兴趣,因此为您和您带来方便。
顺便说一句,weka进行正规化逻辑回归
(Logistic Regression with ridge parameter of 1.0E-8
),因此系数可能与其他软件包可能为您提供的系数略有不同。