我正在进行数据挖掘测试,其中树的大小对我来说并不重要。 有人知道是否有办法在WEKA中增加J48树的大小,这样我才能达到更高的准确度?或者我应该使用其他树算法?
答案 0 :(得分:5)
WEKA的J48是经典C4.5树感应算法的实现。此算法使用称为 pruning 的步骤,其中折叠了一些叶子和内部节点,以避免过度拟合。
您可以使用选项-U
(“使用未修剪的树”)来避免此步骤。这样,树变得更大,因为没有修剪。
然而,这一步几乎是必须的,因为过度拟合。您修剪而不修剪的树很可能对训练数据的调整过多,缺乏概括性,并且在分类过程中将使用的实际数据缺乏准确性。