我建立了一个RandomForestClassifier
并使用GridSearchCV
来调整超级参数。我想要一个具有特征重要性的地块。我的问题是,在处理文本数据时,我不完全知道如何执行此操作,因此我使用了TF-IDF
对其进行矢量化处理。在我的训练数据集中,一列代表一个要素,每一行代表另一个文档。
我找到了这个,但是我不知道如何适应我的情况: Random Forest Feature Importance Chart using Python
我知道为了获得功能的重要性,我使用以下行:
grid_search.best_estimator_.feature_importances_