此培训数据集是否足以用于培训和测试分类模型?

时间:2015-08-03 15:42:33

标签: machine-learning weka svm training-data sample-size

我的训练数据集只包含2个具有40个功能的类。

在案例1中,第1类有35个样本,第2类有700个样本。

在案例2中,第1类有65个样本,第2类与上面的值相同。

我的训练数据集是否足以使用SVM分类器或其他分类器构建模型?

我正在使用WEKA。测试选项 10倍交叉验证%66 ,我获得了非常好的结果。

1 个答案:

答案 0 :(得分:0)

您对结果感到满意,这意味着您有足够的数据。很难说你需要多少数据,这取决于你准确解决的问题,数据中有多少噪音,有哪些功能等。

我在第二部分中描述了它:https://stackoverflow.com/a/31567143/1030820