应用错误收集

分类的实例数和属性的关系

时间：2014-09-24 12:12:06

标签： weka

在我的数据集中，实例数约为200，每个实例都由大约600个属性描述。每个实例都标有（是，否），我试图测试不同的分类器（k-NN，Naive-Bayes，j48）。

生成更多实例非常困难，与属性数量相关的实例数是否最小？

我应该通过功能选择来减少属性，但如果我的属性较少，那么这是一个合理的数字？

1 个答案:

答案 0 :(得分：1)

是否可以减少功能的数量归结为问题的复杂性，但是一些反复试验（或自动特征提取方法）可以确定是否可以减少功能的数量而不会失去准确性。

正如this post中所述，有一些指南或经验法则可用于为模型准备足够的数据。这里的一些建议包括：

至少是培训案例数量的六倍
每个班级的功能数量至少三倍

希望这有帮助！