决策树。噪音策略

时间:2012-11-12 09:12:46

标签: artificial-intelligence data-mining decision-tree

在决策树中打击噪音的好策略是什么?

在我的训练数据中,

我有两个具有相同属性的记录,但它们给出了不同的分类。

  1. 女,奢侈,LV,是
  2. 女,奢侈,LV,没有
  3. 根据我的阅读,它说要返回这两个记录的多个分类。

    但是,当我想进行预测时,这会引发问题,因为我的预测输出应为是或否。

    因此,试图找出在这种情况下我可以用来预测的策略。

    谢谢。

1 个答案:

答案 0 :(得分:0)

当课堂预测尚未确定时:

  1. 最简单(和常见)的方法是预测多数班级
  2. 获取更多信息。例如,包括其他属性(如果可用)或获取更多培训样本(如果可用)。
  3. 删除一些信息。目的是在尽可能多地保留预测信息的同时尽可能多地去除噪声源。通常通过删除无用的属性来完成。在树的情况下,它可以通过修剪来完成。最终你可以删除异常值(比如错误测量的样本),但你必须知道哪个样本是异常值。