我这样做:
from sklearn.linear_model import SGDClassifier
sgclass = SGDClassifier(random_state=10)
sgclass.fit(X_train,y_train)
pred = sgclass.predict(X_test)
from sklearn.metrics import classification_report,accuracy_score
print(classification_report(y_test, pred))
print(accuracy_score(y_test, pred))
这些是有关模型召回率和精度的有用报告。
但是,如何获得最具影响力的预测因变量的自变量?我从大约12位候选人开始,希望了解他们在模型中的影响力排名。
答案 0 :(得分:1)
按照documentation的说明,您可以使用 coef _ 属性获取特征权重。该功能的绝对值越大,其重要性就越大。
您可以在scikit SelectFromModel的功能选择类中看到这一点。从具有属性 feature_importances _ 或 coef _ 的任何分类器中选择最佳功能。