我们是否需要具有相同格式的所有功能,如二进制格式?

时间:2012-08-20 20:00:12

标签: format weka

最近我开始使用Weka Explorer进行分类问题。我有两种类型的功能

  1. 大约1200个要素具有值为{0,1}
  2. 的二进制要素
  3. 大约30个要素有一些数字整数值,如1213.
  4. 目前我正在使用朴素的贝叶斯分类器。

    我的问题是:为了获得更好的分类结果,我是否需要具有二进制格式相同格式的所有功能?

    现在我正在使用weka无监督过滤器NumericToBinary将所有数字要素转换为二进制数据。这是正确的方法吗?

    任何指导都会有所帮助。

1 个答案:

答案 0 :(得分:0)

Weka explorer界面可以快速确定分类器的功能。选择您的分类器并单击其名称。从该界面点击“功能”按钮,见下图。

Weka Classifier capabilities

朴素贝叶斯功能如下。

  

CAPABILITIES   类 - 标称类,二进制类,缺少类值

     

属性 - 数字属性,二进制属性,缺失值,空名义属性,标称值   属性,一元属性

     

附加   min#of instances:0

如您所见,它可以处理数字属性,因此您无需使用过滤器将数字属性更改为二进制。如果它提高了分类器的性能,请使用此过滤器。