我开始使用两个文件training
& testing
。
然后使用libsvm我将这些文件缩放到training.scale
和testing.scale
然后使用grid.py
(libsvm的一部分)我运行了training.scale
并收到了一些交叉验证值:
C = 512
gamme = 0.03125
validation 5 = 66.8421
然后使用svm-train
和training.scale中找到的变量运行grid.py
我得到了一个名为training.scale.model
的新罚款
然后我运行svm-predict
我的新文件testing.predict
并获得了60.8333%的验证%
最后比较testing
和testing.predict
发现有47/120个错误分类
[https://drive.google.com/folderview?id=0BxzgP5V6RPQHekRjZXdFYW9GX0U&usp=sharing][1]
[1]:链接到代码
真正的问题是,为什么会出现这些错误分类的原因?
PS。我为这个问题的糟糕格式道歉,已经持续太久了
答案 0 :(得分:0)
我猜你是机器学习的新手。你得到的结果是完全正确的。
出现这些错误分类的原因是什么?您使用过的功能并不能很好地分类。 66%的交叉验证分数应该给你提示。即使使用普通命中或未命中方法,您也可以获得50%的准确度,而您使用的功能集只能再提高16%。尝试探索新功能。
我假设你的数据集很干净。