在我的数据集中,实例数约为200,每个实例都由大约600个属性描述。每个实例都标有(是,否),我试图测试不同的分类器(k-NN,Naive-Bayes,j48)。
生成更多实例非常困难,与属性数量相关的实例数是否最小?
我应该通过功能选择来减少属性,但如果我的属性较少,那么这是一个合理的数字?
答案 0 :(得分:1)
是否可以减少功能的数量归结为问题的复杂性,但是一些反复试验(或自动特征提取方法)可以确定是否可以减少功能的数量而不会失去准确性。
正如this post中所述,有一些指南或经验法则可用于为模型准备足够的数据。这里的一些建议包括:
希望这有帮助!