我正在使用opencv和HOGDescriptor c ++对象试验人员检测器: HOGDescriptor :: getDefaultPeopleDetector()。使用Opencv 2.4.3存储库的sample / cpp目录中的示例程序peopledetect.cpp,并针对某些INRIA dataset图像对其进行测试..它运行良好。
现在我想尝试一些我必须使用的图像,即使我尝试更改参数..它也找不到任何东西。
我想这是因为我的图像中的行人比INRIA的行人要小得多。所以在训练新探测器之前应该做得更好..
这是我的问题:
是不是?用于训练的图像与检测到的图像之间是否存在严格的关系?这意味着HOG探测器不是真正的尺度不变方法。
特别是,默认HOGDescriptor::getDefaultPeopleDetector()
的最佳大小是多少?我是否需要训练一种新的探测器来探测更小的人?
这是我正在使用的peopledetect.cpp:
#include "opencv2/imgproc/imgproc.hpp"
#include "opencv2/objdetect/objdetect.hpp"
#include "opencv2/highgui/highgui.hpp"
#include <stdio.h>
#include <string.h>
#include <ctype.h>
#include <iostream>
using namespace cv;
using namespace std;
// static void help()
// {
// printf(
// "\nDemonstrate the use of the HoG descriptor using\n"
// " HOGDescriptor::hog.setSVMDetector(HOGDescriptor::getDefaultPeopleDetector());\n"
// "Usage:\n"
// "./peopledetect (<image_filename> | <image_list>.txt)\n\n");
// }
int main(int argc, char** argv)
{
std::cout << "OPENCV version: " << CV_MAJOR_VERSION << " " << CV_MINOR_VERSION << std::endl;
Mat img;
FILE* f = 0;
char _filename[1024];
if( argc == 1 )
{
printf("Usage: peopledetect (<image_filename> | <image_list>.txt)\n");
return 0;
}
img = imread(argv[1]);
if( img.data )
{
strcpy(_filename, argv[1]);
}
else
{
f = fopen(argv[1], "rt");
if(!f)
{
fprintf( stderr, "ERROR: the specified file could not be loaded\n");
return -1;
}
}
HOGDescriptor hog;
hog.setSVMDetector(HOGDescriptor::getDefaultPeopleDetector());
namedWindow("people detector", 1);
for(;;)
{
char* filename = _filename;
if(f)
{
if(!fgets(filename, (int)sizeof(_filename)-2, f))
break;
//while(*filename && isspace(*filename))
// ++filename;
if(filename[0] == '#')
continue;
int l = (int)strlen(filename);
while(l > 0 && isspace(filename[l-1]))
--l;
filename[l] = '\0';
img = imread(filename);
}
printf("%s:\n", filename);
if(!img.data)
continue;
fflush(stdout);
vector<Rect> found, found_filtered;
double t = (double)getTickCount();
// run the detector with default parameters. to get a higher hit-rate
// (and more false alarms, respectively), decrease the hitThreshold and
// groupThreshold (set groupThreshold to 0 to turn off the grouping completely).
hog.detectMultiScale(img, found, 0, Size(8,8), Size(32,32), 1.05, 2);
t = (double)getTickCount() - t;
printf("tdetection time = %gms\n", t*1000./cv::getTickFrequency());
std::cout << "found: " << found.size() << std::endl;
size_t i, j;
for( i = 0; i < found.size(); i++ )
{
Rect r = found[i];
for( j = 0; j < found.size(); j++ )
if( j != i && (r & found[j]) == r)
break;
if( j == found.size() )
found_filtered.push_back(r);
}
for( i = 0; i < found_filtered.size(); i++ )
{
Rect r = found_filtered[i];
// the HOG detector returns slightly larger rectangles than the real objects.
// so we slightly shrink the rectangles to get a nicer output.
r.x += cvRound(r.width*0.1);
r.width = cvRound(r.width*0.8);
r.y += cvRound(r.height*0.07);
r.height = cvRound(r.height*0.8);
rectangle(img, r.tl(), r.br(), cv::Scalar(0,255,0), 3);
}
imshow("people detector", img);
int c = waitKey(0) & 255;
if( c == 'q' || c == 'Q' || !f)
break;
}
if(f)
fclose(f);
return 0;
}
答案 0 :(得分:2)
HOG使用经过训练的数据。为了有效地使用它,您有3种可能性:
使用与训练数据相同/近似类型数据的图像(例如INRIA数据集拍摄)(简单方法)
构建您自己的训练数据以与HOG一起使用。 (艰难的)
找到一个非常通用的SVM集,可以在任何地方应用(很难找到)
答案 1 :(得分:2)
在blackibiza answer中,我有两个主要选择:找到一个已经训练过的分类器,或者为我自己做。
所以,最后,我设法用svmlight训练了一个Hog分类器,并且在opencv中包含了svm。
答案是肯定的:检测取决于用于培训的样本量。如果分类器获得64x128像素的样本并且您尝试检测较小的对象,则它不起作用。但事实恰恰相反:你可以检测到更大的物体(虽然金字塔在图像下方并进行多尺度检测,也在opencv中实现)。
即使未在CPU部分中记录,您也可以在网络中的某个位置找到,或者您可以使用最后一个(版本2.4.8)opencv并查看gpu模块,您将看到这些方法:gpu::HOGDescriptor::getPeopleDetector48x96
和gpu::HOGDescriptor::getPeopleDetector64x128
,这是两个已经训练过的生猪探测器。
作为最后一句话,我被告知培训时间,但有500个样本(或多或少),使用普通笔记本电脑的培训过程只需几分钟。