Question

我的目标是使用SVM w / HOG功能对轿车和SUV下的车辆进行分类。

我使用了各种内核（RBF，LINEAR，POLY），每种内核都给出了不同的结果，但无论参数如何变化，它们都能得到相同的结果。例如，如果我使用的是POLY内核并且度数大于或等于.65，它会将所有内容归类为SUV，如果小于.65则将所有测试图像归类为轿车。

使用LINEAR内核，唯一更改的参数是C.无论参数C是什么，我总是将8/10图像分类为轿车，同样2分类为SUV。

现在我只有大约70张训练图像和10张测试图像，我还没有能够从后面和上面找到一个很好的车辆数据集，就像我将使用它的桥梁一样。问题可能是由于这个小数据集，参数还是别的？另外，我看到我的支持向量通常很高，比如70个训练图像中的58个，所以这可能是数据集的问题？有没有办法让我以某种方式可视化训练点 - 在SVM示例中，他们总是有一个漂亮的2D点图并绘制一条直线，但是有没有办法用图像绘制这些点，所以我可以看到我的数据是线性可分的，并进行相应的调整？我的HOG参数对于150x200的汽车图像是否准确？

另请注意，当我使用与训练图像相同的测试图像时，SVM模型可以完美地预测，但显然是在作弊。

下图显示了结果，以及测试图像的示例

这是我的代码，我没有包含大部分代码，因为我不确定代码是否存在问题。首先，我拍摄正面图像，提取HOG特征，然后将它们加载到训练垫中，然后对负片图像执行相同的操作，就像我对包含的测试部分一样。

    //Set SVM Parameters (not sure about these values, but just wanna see something)
Ptr<SVM> svm = SVM::create();
svm->setType(SVM::C_SVC);
svm->setKernel(SVM::POLY);
svm->setC(50);
svm->setGamma(100);
svm->setDegree(.65);
//svm->setTermCriteria(TermCriteria(TermCriteria::MAX_ITER, 100, 1e-6));

cout << "Parameters Set..." << endl;

svm->train(HOGFeat_train, ROW_SAMPLE, labels_mat);

Mat SV = svm->getSupportVectors();
Mat USV = svm->getUncompressedSupportVectors();

cout << "Support Vectors: " << SV.rows << endl;
cout << "Uncompressed Support Vectors: " << USV.rows << endl;

cout << "Training Successful" << endl;

waitKey(0);

//TESTING PORTION

cout << "Begin Testing..." << endl;

int num_test_images = 10;
Mat HOGFeat_test(1, derSize, CV_32FC1); //Creates a 1 x descriptorSize Mat to house the HoG features from the test image

for (int file_count = 1; file_count < (num_test_images + 1); file_count++)
{

    test << nameTest << file_count << type;     //'Test_1.jpg' ... 'Test_2.jpg' ... etc ...
    string filenameTest = test.str();
    test.str("");

    Mat test_image = imread(filenameTest, 0);           //Read the file folder

    HOGDescriptor hog_test;// (Size(64, 64), Size(32, 32), Size(16, 16), Size(32, 32), 9, 1, -1, 0, .2, 1, 64, false);
    vector<float> descriptors_test;
    vector<Point> locations_test;

    hog_test.compute(test_image, descriptors_test, Size(64, 64), Size(0, 0), locations_test);

    for (int i = 0; i < descriptors_test.size(); i++)
        HOGFeat_test.at<float>(0, i) = descriptors_test.at(i);

    namedWindow("Test Image", CV_WINDOW_NORMAL);
    imshow("Test Image", test_image);

    //Should return a 1 if its an SUV, or a -1 if its a sedan
    float result = svm->predict(HOGFeat_test);

    if (result <= 0)
        cout << "Sedan" << endl;
    else
        cout << "SUV" << endl;

    cout << "Result: " << result << endl;

    waitKey(0);
}

Answer 1

有两件事解决了这个问题：

1）我获得了更大的车辆数据集。我为训练部分使用了大约400张SUV图像和400张轿车图像，然后为测试部分使用了另外50张图像。

2）在：Mat HOGFeat_test（1，derSize，CV_32FC1）中，我的derSize错误大约一个数量级。实际大小是15120，但我有Mat有113400列。因此，我只使用有用的特征数据填充了大约10％的测试垫，因此SVM很难说出SUV和轿车之间的任何差异。

现在它适用于线性和多核（C = 10），我的准确度比我预期的高出96％。

使用不同参数测试我的SVM模型会产生完全相同的结果

1 个答案: