应用错误收集

我知道这里曾多次提出过类似的问题，但我还有另外一点我不清楚。

我有1098张图片正在尝试分类。作为一般规则（根据我的阅读），数据的分割是

80/20 - 训练/测试

80％的培训数据

80/20或90/10进行20倍或10倍的交叉验证。

现在我遇到的问题是数据的原始80/20分割是随机完成的。因此，如果我重复数据的随机抽样（进入训练/测试用例）一百次并执行交叉验证，我发现最佳SVM参数正在发生变化。

所以基本上，我很困惑我应该如何分割数据，当我随机进行时，我不会在每个样本上得到可重复的结果。我该怎么办？

我正在使用带有RBF内核的libsvm。对数据进行30次抽样的例子给出了以下内容：

文本格式不正确，因此我附加了包含该信息的文本文件的链接。括号中的值为[C gamma]。

如何选择最佳训练集以及如何选择最佳参数......是否有智能的方法？