我使用libSVM创建了一个多类SVM模型来对图像进行分类。我使用网格搜索优化了C和G参数,并使用了RBF内核。
课程是1)动物2)花卉3)风景4)肖像。
我的训练集是来自每个类别的100张图像,并且对于每个图像,我使用Lear的Gist Descriptor C代码http://lear.inrialpes.fr/software提取了920长度的矢量。
在50个图像/类别上测试我的模型后,我的准确度达到了约50%,这是随机的两倍(25%,因为有四个类别)。
我对计算机视觉比较陌生,但熟悉机器学习技巧。关于如何有效提高准确性的任何建议?
非常感谢,我期待着您的回复!
答案 0 :(得分:0)
这是非常非常开放的研究挑战。从理论上讲,没有一个答案可以保证更好。
鉴于你的类别,它并不是一个糟糕的开始,但请记住,Gist最初被设计为场景分类的全局描述符(虽然经验证明对其他图像类别有用)。在表示方面,我建议尝试基于颜色的功能,如基于补丁的直方图以及流行的低级渐变功能,如SIFT。如果你刚刚开始学习计算机视觉,那么我会说SVM对于你正在做的事情是充足的,这取决于你的图像集的可变性,例如:照明,视角,焦点等。