我最近致力于图像识别。一个数据点由一个特征向量x
及其标签y
组成。我使用的图像功能是这样的:gist,color histgram,HOG。我将这些功能矢量化并将它们组合在一起以形成x
。对于标签y
,它只能是21个标签中的一个。
然后我将整个数据集随机分成两部分。我在第一部分训练了分类器并测试了第二部分的准确性。我使用的分类器是随机森林和支持向量机。 但结果表明:对于随机森林,训练精度为0.99,而测试精度为0.73;对于支持向量机,测试精度为0.20。
有谁可以告诉我他们为何如此不同?