Weka:如何在J48决策树中实现代理拆分?

时间:2014-07-08 10:55:49

标签: java weka decision-tree missing-data surrogate-pairs

任何人都可以帮助我使用Java中的Weka API在J48算法中实现替代缺失值处理。

我确信在训练J48之前使用预先插补方法很容易。

但是,如果分区训练日期(就像Breiman在CART中做的那样)使用代理拆分属性而不是J48标准方法(C4.5中的Quinlan)将案例分割为来自观察案例的概率分布已知价值。

任何人都可以给我一些信息,提示,帮助,Weka API和源代码中的哪些内容必须修改以替换标准代理分割?

1 个答案:

答案 0 :(得分:1)

从第152行查看weka源代码weka.classifiers.trees.j48.C45ModelSelection(查找"最佳"要拆分的属性)。它使用信息增益比作为分裂标准。