属性选择+ weka +朴素贝叶斯

时间:2012-03-26 10:02:06

标签: weka naivebayes document-classification

我想知道以下三种方法中哪种方法最适合执行属性选择:

  1. 使用元分类器
  2. 过滤方法
  3. 原生方法,直接使用属性选择类
  4. 我使用的分类器是Naive Bayes。

    有人能引导我找到最佳选择吗?

2 个答案:

答案 0 :(得分:1)

有一种称为No free lunch的理论。您应该在问题中尝试所有这三个问题,并在您的域中生成一个衡量标准。

答案 1 :(得分:0)

嗯,没有一个答案。

  1. 您可以使用决策树分类器(如装袋)并选择分类器采取分支决策的属性。您可以看到树当然要看分支和基于分支的属性(这些属性很重要)。

  2. 您可以使用前向选择或后向消除技术。 (a)在前向选择中,使用单个功能,验证/测试集上的错误最少。然后,使用功能池中包含的此功能,一次尝试其余功能,并选择再次提供最少错误的功能。 (b)在反向消除中,使用所有功能并采用错误率。然后一次消除一个功能。然后选择要从功能池中取出的功能,以最大限度地减少错误。

  3. 除非您对功能数量(停止标准)感到满意,否则请继续此过程。

    1. 我个人使用排名算法和infogain属性评估器首先对属性进行排名,然后使用2(a)或2(b)来选择属性。
    2. 错误 - 您可以考虑均方根误差。其他人也可以做得很好。