尝试应用sklearn ExtraTreesClassifier()来检测数据集(new_y dataframe)中要素的重要性。所以我从数据集(x)和列名(y)中选择值并尝试制作模型:
from sklearn.ensemble import ExtraTreesClassifier
arrX=new_y.values
arrY=new_y.columns.values
model = ExtraTreesClassifier()
model.fit(arrX,arrY)
model.feature_importances_
它给我一个错误,例如'标签数量= 18与样本数量不匹配= 161389' 那么我做错了什么以及应该如何正确地做到这一点?