我的目标是使用SVM w / HOG功能对轿车和SUV下的车辆进行分类。
我使用了各种内核(RBF,LINEAR,POLY),每种内核都给出了不同的结果,但无论参数如何变化,它们都能得到相同的结果。例如,如果我使用的是POLY内核并且度数大于或等于.65,它会将所有内容归类为SUV,如果小于.65则将所有测试图像归类为轿车。
使用LINEAR内核,唯一更改的参数是C.无论参数C是什么,我总是将8/10图像分类为轿车,同样2分类为SUV。
现在我只有大约70张训练图像和10张测试图像,我还没有能够从后面和上面找到一个很好的车辆数据集,就像我将使用它的桥梁一样。问题可能是由于这个小数据集,参数还是别的?另外,我看到我的支持向量通常很高,比如70个训练图像中的58个,所以这可能是数据集的问题?有没有办法让我以某种方式可视化训练点 - 在SVM示例中,他们总是有一个漂亮的2D点图并绘制一条直线,但是有没有办法用图像绘制这些点,所以我可以看到我的数据是线性可分的,并进行相应的调整?我的HOG参数对于150x200的汽车图像是否准确?
另请注意,当我使用与训练图像相同的测试图像时,SVM模型可以完美地预测,但显然是在作弊。
下图显示了结果,以及测试图像的示例
这是我的代码,我没有包含大部分代码,因为我不确定代码是否存在问题。首先,我拍摄正面图像,提取HOG特征,然后将它们加载到训练垫中,然后对负片图像执行相同的操作,就像我对包含的测试部分一样。
//Set SVM Parameters (not sure about these values, but just wanna see something)
Ptr<SVM> svm = SVM::create();
svm->setType(SVM::C_SVC);
svm->setKernel(SVM::POLY);
svm->setC(50);
svm->setGamma(100);
svm->setDegree(.65);
//svm->setTermCriteria(TermCriteria(TermCriteria::MAX_ITER, 100, 1e-6));
cout << "Parameters Set..." << endl;
svm->train(HOGFeat_train, ROW_SAMPLE, labels_mat);
Mat SV = svm->getSupportVectors();
Mat USV = svm->getUncompressedSupportVectors();
cout << "Support Vectors: " << SV.rows << endl;
cout << "Uncompressed Support Vectors: " << USV.rows << endl;
cout << "Training Successful" << endl;
waitKey(0);
//TESTING PORTION
cout << "Begin Testing..." << endl;
int num_test_images = 10;
Mat HOGFeat_test(1, derSize, CV_32FC1); //Creates a 1 x descriptorSize Mat to house the HoG features from the test image
for (int file_count = 1; file_count < (num_test_images + 1); file_count++)
{
test << nameTest << file_count << type; //'Test_1.jpg' ... 'Test_2.jpg' ... etc ...
string filenameTest = test.str();
test.str("");
Mat test_image = imread(filenameTest, 0); //Read the file folder
HOGDescriptor hog_test;// (Size(64, 64), Size(32, 32), Size(16, 16), Size(32, 32), 9, 1, -1, 0, .2, 1, 64, false);
vector<float> descriptors_test;
vector<Point> locations_test;
hog_test.compute(test_image, descriptors_test, Size(64, 64), Size(0, 0), locations_test);
for (int i = 0; i < descriptors_test.size(); i++)
HOGFeat_test.at<float>(0, i) = descriptors_test.at(i);
namedWindow("Test Image", CV_WINDOW_NORMAL);
imshow("Test Image", test_image);
//Should return a 1 if its an SUV, or a -1 if its a sedan
float result = svm->predict(HOGFeat_test);
if (result <= 0)
cout << "Sedan" << endl;
else
cout << "SUV" << endl;
cout << "Result: " << result << endl;
waitKey(0);
}
答案 0 :(得分:0)
有两件事解决了这个问题:
1)我获得了更大的车辆数据集。我为训练部分使用了大约400张SUV图像和400张轿车图像,然后为测试部分使用了另外50张图像。
2)在:Mat HOGFeat_test(1,derSize,CV_32FC1)中,我的derSize错误大约一个数量级。实际大小是15120,但我有Mat有113400列。因此,我只使用有用的特征数据填充了大约10%的测试垫,因此SVM很难说出SUV和轿车之间的任何差异。
现在它适用于线性和多核(C = 10),我的准确度比我预期的高出96%。