scikit - RandomForestClassifier查询

时间:2013-06-27 18:08:46

标签: scikit-learn

我有问题要理解使用scikit这两个步骤是否相似:

1)具有compute_importance = True的RandomForestClassifier,并手动选择返回的前10个特征,以进一步创建10个特征的新训练集,并训练和进一步预测。

2)RandomforestClassifier,其中max_feature = 10 compute_importance = True并进一步使用rf.fit_transform(train,target)和rf.fit(train,target)

1 个答案:

答案 0 :(得分:0)

max_features=10表示从整个集合中选择10个特征的新随机子集作为分裂的候选者。换句话说,每次都在考虑不同的10个特征。所有原始特征仍然可能最终被用于同一树中的某个地方,因此也可能在整个森林中使用。选择10个最重要的功能和重新训练意味着在任何地方都使用相同的10个功能,这通常不是一个好主意。