使用新数据更新决策树

时间:2018-06-22 23:23:46

标签: decision-tree

我是决策树的新手。我正计划建立一个大型决策树,我希望稍后再使用其他数据进行更新。最好的方法是什么?以后可以更新任何决策树吗?

1 个答案:

答案 0 :(得分:1)

决策树最常接受所有可用数据的训练。也就是说,当您拥有新数据时,您将重新训练整个树。由于此过程非常快,因此通常不会出现问题。如果数据太大而无法容纳在内存中,则通常可以通过对训练集进行二次采样(行采样)来解决它,因为基于树的模型不需要那么多数据即可获得良好的结果。

请注意,决策树非常适合过度拟合,因此您应考虑使用随机森林或其他集成方法。使用装袋可以在不同的数据子集上训练不同的树。

还存在用于决策树的增量和在线学习方法。 CART,ID3和VFDT学习器就是一些示例。