我的训练数据集只包含2个具有40个功能的类。
在案例1中,第1类有35个样本,第2类有700个样本。
在案例2中,第1类有65个样本,第2类与上面的值相同。
我的训练数据集是否足以使用SVM分类器或其他分类器构建模型?
我正在使用WEKA。测试选项 10倍交叉验证和%66 ,我获得了非常好的结果。
答案 0 :(得分:0)
您对结果感到满意,这意味着您有足够的数据。很难说你需要多少数据,这取决于你准确解决的问题,数据中有多少噪音,有哪些功能等。
我在第二部分中描述了它:https://stackoverflow.com/a/31567143/1030820