Warm_start / Batch训练随机森林分类器(Python)

时间:2018-10-14 20:43:22

标签: python classification random-forest

我做了一个随机森林分类器(rfc),但是由于我的数据由130k行组成,每行有7250个列,因此我没有足够的内存来全部加载并将其传递给RFC,因此我正在寻找一些批处理-训练。 据我了解,在rfc中使用warm_start=True应该可以做到这一点。不过,我有点困惑,因为使用warm_start似乎使林中的第i棵树使用了先前(和新批次)中的信息来创建树i + 1。但是,由于森林由多棵树和多数票组成,那么我是不是真的得到了一个随机森林,还是实际上只是一棵树(最后一棵)?如果它是一个随机森林,那么最后一棵树应该比第一棵树更准确(如果我正确理解的话),那么它是否具有某种权重或..

0 个答案:

没有答案