应用错误收集

此培训数据集是否足以用于培训和测试分类模型？

时间：2015-08-03 15:42:33

标签： machine-learning weka svm training-data sample-size

我的训练数据集只包含2个具有40个功能的类。

在案例1中，第1类有35个样本，第2类有700个样本。

在案例2中，第1类有65个样本，第2类与上面的值相同。

我的训练数据集是否足以使用SVM分类器或其他分类器构建模型？

我正在使用WEKA。测试选项 10倍交叉验证和％66 ，我获得了非常好的结果。

1 个答案:

答案 0 :(得分：0)

您对结果感到满意，这意味着您有足够的数据。很难说你需要多少数据，这取决于你准确解决的问题，数据中有多少噪音，有哪些功能等。

我在第二部分中描述了它：https://stackoverflow.com/a/31567143/1030820