应用错误收集

使用Gist描述符进行图像分类

时间：2013-06-25 00:22:44

标签： graphics machine-learning computer-vision classification libsvm

我使用libSVM创建了一个多类SVM模型来对图像进行分类。我使用网格搜索优化了C和G参数，并使用了RBF内核。

课程是1）动物2）花卉3）风景4）肖像。

我的训练集是来自每个类别的100张图像，并且对于每个图像，我使用Lear的Gist Descriptor C代码http://lear.inrialpes.fr/software提取了920长度的矢量。

在50个图像/类别上测试我的模型后，我的准确度达到了约50％，这是随机的两倍（25％，因为有四个类别）。

我对计算机视觉比较陌生，但熟悉机器学习技巧。关于如何有效提高准确性的任何建议？

非常感谢，我期待着您的回复！

1 个答案:

答案 0 :(得分：0)

这是非常非常开放的研究挑战。从理论上讲，没有一个答案可以保证更好。

鉴于你的类别，它并不是一个糟糕的开始，但请记住，Gist最初被设计为场景分类的全局描述符（虽然经验证明对其他图像类别有用）。在表示方面，我建议尝试基于颜色的功能，如基于补丁的直方图以及流行的低级渐变功能，如SIFT。如果你刚刚开始学习计算机视觉，那么我会说SVM对于你正在做的事情是充足的，这取决于你的图像集的可变性，例如：照明，视角，焦点等。