Python中二进制分类器的值重要性

时间:2017-01-17 12:47:21

标签: python statistics scikit-learn feature-selection

我在Python 3.5中创建二进制分类器

具有特征数量(x1..xn)和目标值y就像这样:

x1        x2 x3  y
Monday    10 12  1
Tuesday   18 20  0
Monday    12 22  1
Wednesday 19 19  0
Thursday  10 11  1
Thursday  10 12  1
Friday    19 12  0 
Friday    18 21  0
Friday    12 10  1

所以我没有问题做分类器(以及所有需要的步骤作为数据预处理,交叉验证和评估)。

我的问题 - 如何估算y变量是否存在显着变化,具体取决于星期几(星期一至星期五),第x1列?

我知道一些技术作为特征重要性但使用它们我只能理解什么确切的特征(x1,x2或x3)对预测器最有价值。

如何理解目标变量列(x1,星期几)内不同值的重要性?

谢谢!

1 个答案:

答案 0 :(得分:0)

x1列中的值可以转换为具有二进制逻辑值([0; 1])的列。然后可以应用特征重要性技术。

http://scikit-learn.org/stable/auto_examples/ensemble/plot_forest_importances.html