使用python的sklearn ExtraTreesClassifier具有重要性

时间:2016-10-24 09:14:05

标签: python scikit-learn feature-selection

尝试应用sklearn ExtraTreesClassifier()来检测数据集(new_y dataframe)中要素的重要性。所以我从数据集(x)和列名(y)中选择值并尝试制作模型:

from sklearn.ensemble import ExtraTreesClassifier

arrX=new_y.values
arrY=new_y.columns.values

model = ExtraTreesClassifier()
model.fit(arrX,arrY)

model.feature_importances_

它给我一个错误,例如'标签数量= 18与样本数量不匹配= 161389' 那么我做错了什么以及应该如何正确地做到这一点?

0 个答案:

没有答案