随机森林用于非常大的数据集

时间:2014-08-04 11:38:21

标签: c++ r random-forest

我有一个 100亿样本(10 ^ 10)的数据集,有100个功能(是的,我也有标签)。我想训练随机森林进行分类。

是否有可能在随机抽样的子集(一个接一个)上训练10000个决策树并将这些树组合到一个森林中?如果是,怎么做?

0 个答案:

没有答案