我正在为随机森林分类器算法运行功能减少(从500到大约30)。我可以减少功能的数量,但是我希望看到在减少的每一点都留下了什么功能。正如你在下面看到的那样,我已经尝试了,但是没有用。
X不包含ColumnNames。理想情况下,也可以在X中使用列名,但只能从行中拟合,然后我认为可以打印X.
我确信有更好的方法......
有人知道怎么做吗?
FEATURES = []
readThisFile = r'C:\ManyFeatures.txt'
featuresFile = open(readThisFile)
AllFeatures = featuresFile.read()
FEATURES = AllFeatures.split('\n')
featuresFile.close()
Location = r'C:\MASSIVE.xlsx'
data = pd.read_excel(Location)
X = np.array(data[FEATURES])
y = data['_MiniTARGET'].values
for x in range(533, 10,-100):
X = SelectKBest(f_classif, k=x).fit_transform(X, y)
#U=pd.DataFrame(X)
#print (U.feature_importances_)