任何人都可以帮助我使用Java中的Weka API在J48算法中实现替代缺失值处理。
我确信在训练J48之前使用预先插补方法很容易。
但是,如果分区训练日期(就像Breiman在CART中做的那样)使用代理拆分属性而不是J48标准方法(C4.5中的Quinlan)将案例分割为来自观察案例的概率分布已知价值。
任何人都可以给我一些信息,提示,帮助,Weka API和源代码中的哪些内容必须修改以替换标准代理分割?
答案 0 :(得分:1)
从第152行查看weka源代码weka.classifiers.trees.j48.C45ModelSelection(查找"最佳"要拆分的属性)。它使用信息增益比作为分裂标准。