分类的实例数和属性的关系

时间:2014-09-24 12:12:06

标签: weka

在我的数据集中,实例数约为200,每个实例都由大约600个属性描述。每个实例都标有(是,否),我试图测试不同的分类器(k-NN,Naive-Bayes,j48)。

生成更多实例非常困难,与属性数量相关的实例数是否最小?

我应该通过功能选择来减少属性,但如果我的属性较少,那么这是一个合理的数字?

1 个答案:

答案 0 :(得分:1)

是否可以减少功能的数量归结为问题的复杂性,但是一些反复试验(或自动特征提取方法)可以确定是否可以减少功能的数量而不会失去准确性。

正如this post中所述,有一些指南或经验法则可用于为模型准备足够的数据。这里的一些建议包括:

  • 至少是培训案例数量的六倍
  • 每个班级的功能数量至少三倍

希望这有帮助!