有没有办法使用SVM构建包含预定百分比的训练数据的模型?

时间:2013-04-25 16:02:06

标签: machine-learning classification svm libsvm

说,我希望使用LIBSVM构建一个包含70%训练数据的模型。这可能吗?

2 个答案:

答案 0 :(得分:0)

没有任何技术可以让您准确指定模型将包含多少支持向量。一个可能的例外是固定大小的最小二乘SVM公式,它允许您提前指定内核的大小(对于LS-SVM,每个训练实例都是SV)。

请注意,在大多数情况下,典型SVM中70%支持向量的一小部分非常高,因此我无法立即看到您想要的原因。

然而,您可以使用Schölkopf等人的nu-SVM等公式指定支持向量的最小分数:

B中。 Schölkopf,A。Smola,R。C. Williamson和P. L. Bartlett。新的支持向量 算法。 Neural Computation,12:1207-1245,2000。

在该配方中,您将至少具有分数nu支持向量(0 -s 1或对nu-SVR使用-s 4)。有关详细信息,您可以参考this pdf (page 4)或google nu-SVM查找有关它的各种论文。

答案 1 :(得分:0)

如果你查看libsvm的tools文件夹,你会发现一个名为subset.py的python脚本。您可以使用它随机选择数据的子集进行培训。