这些实例可能被错误分类的原因是什么?

时间:2015-01-08 05:41:37

标签: classification svm libsvm cross-validation predict

我开始使用两个文件training& testing

然后使用libsvm我将这些文件缩放到training.scaletesting.scale

然后使用grid.py(libsvm的一部分)我运行了training.scale并收到了一些交叉验证值:

C = 512
gamme = 0.03125
validation 5 = 66.8421

然后使用svm-train和training.scale中找到的变量运行grid.py我得到了一个名为training.scale.model的新罚款

然后我运行svm-predict我的新文件testing.predict并获得了60.8333%的验证%

最后比较testingtesting.predict发现有47/120个错误分类

[https://drive.google.com/folderview?id=0BxzgP5V6RPQHekRjZXdFYW9GX0U&usp=sharing][1]

[1]:链接到代码

真正的问题是,为什么会出现这些错误分类的原因?

PS。我为这个问题的糟糕格式道歉,已经持续太久了

1 个答案:

答案 0 :(得分:0)

我猜你是机器学习的新手。你得到的结果是完全正确的。

出现这些错误分类的原因是什么?您使用过的功能并不能很好地分类。 66%的交叉验证分数应该给你提示。即使使用普通命中或未命中方法,您也可以获得50%的准确度,而您使用的功能集只能再提高16%。尝试探索新功能。

我假设你的数据集很干净。