我正在尝试使用Matlab“TreeBagger”类训练分类器(特别是决策林)。
我从TreeBagger的在线文档中注意到,有几个方法/属性可用于查看每个数据点功能对于区分数据点类别的重要性。
我找到的两个是ComputeOOBVarImp属性和ClassificationTree.predictorImportance方法。在我构建的决策林/袋装树集合中使用后者,我发现许多数据点特征对分类器没有重要性。
我可以使用TreeBagger类或与之结合使用,以便我的树使用弱学习器/分割标准,这些标准不仅仅是单个输入数据特征的边界,而是这些特征的线性组合,为了改善每个节点拆分的“信息增益”。
我认为这归结为数据的降维,我没有在Matlab中处理的经验。
感谢。