标签: replace weka missing-data
答案 0 :(得分:1)
如果您想通过从特定A类的训练实例中计算出的平均值来替换A类的缺失值,那么您将“偏向”数据集。为避免偏见(最终会使训练模型过度拟合),最好使用默认的“替换缺失值”功能 - 即考虑所有训练实例的均值和模式,而不仅仅考虑该特定类别。