Question

我开始使用两个文件training＆amp; testing。

然后使用libsvm我将这些文件缩放到training.scale和testing.scale

然后使用grid.py（libsvm的一部分）我运行了training.scale并收到了一些交叉验证值：

C = 512
gamme = 0.03125
validation 5 = 66.8421

然后使用svm-train和training.scale中找到的变量运行grid.py我得到了一个名为training.scale.model的新罚款

然后我运行svm-predict我的新文件testing.predict并获得了60.8333％的验证％

最后比较testing和testing.predict发现有47/120个错误分类

[1]：链接到代码

真正的问题是，为什么会出现这些错误分类的原因？

PS。我为这个问题的糟糕格式道歉，已经持续太久了

Answer 1

我猜你是机器学习的新手。你得到的结果是完全正确的。

出现这些错误分类的原因是什么？您使用过的功能并不能很好地分类。 66％的交叉验证分数应该给你提示。即使使用普通命中或未命中方法，您也可以获得50％的准确度，而您使用的功能集只能再提高16％。尝试探索新功能。

我假设你的数据集很干净。