使用Gist描述符进行图像分类

时间:2013-06-25 00:22:44

标签: graphics machine-learning computer-vision classification libsvm

我使用libSVM创建了一个多类SVM模型来对图像进行分类。我使用网格搜索优化了C和G参数,并使用了RBF内核。

课程是1)动物2)花卉3)风景4)肖像。

我的训练集是来自每个类别的100张图像,并且对于每个图像,我使用Lear的Gist Descriptor C代码http://lear.inrialpes.fr/software提取了920长度的矢量。

在50个图像/类别上测试我的模型后,我的准确度达到了约50%,这是随机的两倍(25%,因为有四个类别)。

我对计算机视觉比较陌生,但熟悉机器学习技巧。关于如何有效提高准确性的任何建议?

非常感谢,我期待着您的回复!

1 个答案:

答案 0 :(得分:0)

这是非常非常开放的研究挑战。从理论上讲,没有一个答案可以保证更好。

鉴于你的类别,它并不是一个糟糕的开始,但请记住,Gist最初被设计为场景分类的全局描述符(虽然经验证明对其他图像类别有用)。在表示方面,我建议尝试基于颜色的功能,如基于补丁的直方图以及流行的低级渐变功能,如SIFT。如果你刚刚开始学习计算机视觉,那么我会说SVM对于你正在做的事情是充足的,这取决于你的图像集的可变性,例如:照明,视角,焦点等。