在scikit-learn随机梯度下降分类器中,如何找到最有影响力的自变量?

时间:2018-09-30 23:02:54

标签: scikit-learn gradient-descent

我这样做:

from sklearn.linear_model import SGDClassifier
sgclass = SGDClassifier(random_state=10)
sgclass.fit(X_train,y_train)
pred = sgclass.predict(X_test)
from sklearn.metrics import classification_report,accuracy_score
print(classification_report(y_test, pred))
print(accuracy_score(y_test, pred)) 

这些是有关模型召回率和精度的有用报告。

但是,如何获得最具影响力的预测因变量的自变量?我从大约12位候选人开始,希望了解他们在模型中的影响力排名。

1 个答案:

答案 0 :(得分:1)

按照documentation的说明,您可以使用 coef _ 属性获取特征权重。该功能的绝对值越大,其重要性就越大。

您可以在scikit SelectFromModel的功能选择类中看到这一点。从具有属性 feature_importances _ coef _ 的任何分类器中选择最佳功能。