使用Surf进行物体检测

时间:2013-07-10 12:16:04

标签: opencv image-processing computer-vision

我正在尝试从视频中检测到车辆,我会在实时应用程序中进行检测,但暂时并且为了理解我正在视频中执行此操作,代码如下:

void surf_detection(Mat img_1,Mat img_2); /** @function main */

int main( int argc, char** argv )
{

 int i;
 int key;

 CvCapture* capture = cvCaptureFromAVI("try2.avi");// Read the video file

 if (!capture){

     std::cout <<" Error in capture video file";
     return -1;
 }

 Mat img_template = imread("images.jpg"); // read template image

int numFrames = (int) cvGetCaptureProperty(capture,  CV_CAP_PROP_FRAME_COUNT);



IplImage* img = 0; 

for(i=0;i<numFrames;i++){
  cvGrabFrame(capture);          // capture a frame
  img=cvRetrieveFrame(capture);  // retrieve the captured frame


  surf_detection (img_template,img);

  cvShowImage("mainWin", img); 
  key=cvWaitKey(20);           

}

 return 0;
 }

void surf_detection(Mat img_1,Mat img_2)
{ 

if( !img_1.data || !img_2.data )
{ 
    std::cout<< " --(!) Error reading images " << std::endl; 

}




//-- Step 1: Detect the keypoints using SURF Detector
int minHessian = 400;
SurfFeatureDetector detector( minHessian );
std::vector<KeyPoint> keypoints_1, keypoints_2;

std::vector< DMatch > good_matches;

do{ 

detector.detect( img_1, keypoints_1 );
detector.detect( img_2, keypoints_2 );

//-- Draw keypoints

Mat img_keypoints_1; Mat img_keypoints_2;
drawKeypoints( img_1, keypoints_1, img_keypoints_1, Scalar::all(-1), DrawMatchesFlags::DEFAULT );
drawKeypoints( img_2, keypoints_2, img_keypoints_2, Scalar::all(-1), DrawMatchesFlags::DEFAULT );

//-- Step 2: Calculate descriptors (feature vectors)
SurfDescriptorExtractor extractor;
Mat descriptors_1, descriptors_2;
extractor.compute( img_1, keypoints_1, descriptors_1 );
extractor.compute( img_2, keypoints_2, descriptors_2 );


//-- Step 3: Matching descriptor vectors using FLANN matcher
FlannBasedMatcher matcher;
std::vector< DMatch > matches;
matcher.match( descriptors_1, descriptors_2, matches );
double max_dist = 0; 
double min_dist = 100;

//-- Quick calculation of max and min distances between keypoints
for( int i = 0; i < descriptors_1.rows; i++ )
{ 
    double dist = matches[i].distance;
if( dist < min_dist )
    min_dist = dist;
if( dist > max_dist ) 
    max_dist = dist;
}


//-- Draw only "good" matches (i.e. whose distance is less than 2*min_dist )


for( int i = 0; i < descriptors_1.rows; i++ )
{ 
    if( matches[i].distance < 2*min_dist )
        { 
                good_matches.push_back( matches[i]);
        }
}

}while(good_matches.size()<100);

//-- Draw only "good" matches
Mat img_matches;
drawMatches( img_1, keypoints_1, img_2, keypoints_2,good_matches, img_matches, Scalar::all(-1), Scalar::all(-1),
vector<char>(), DrawMatchesFlags::NOT_DRAW_SINGLE_POINTS );

//-- Localize the object
std::vector<Point2f> obj;
std::vector<Point2f> scene;
for( int i = 0; i < good_matches.size(); i++ )
{
//-- Get the keypoints from the good matches
obj.push_back( keypoints_1[ good_matches[i].queryIdx ].pt );
scene.push_back( keypoints_2[ good_matches[i].trainIdx ].pt );
}


Mat H = findHomography( obj, scene, CV_RANSAC );


//-- Get the corners from the image_1 ( the object to be "detected" )
std::vector<Point2f> obj_corners(4);
obj_corners[0] = Point2f(0,0); 
obj_corners[1] = Point2f( img_1.cols, 0 );
obj_corners[2] = Point2f( img_1.cols, img_1.rows ); 
obj_corners[3] = Point2f( 0, img_1.rows );
std::vector<Point2f> scene_corners(4);

perspectiveTransform( obj_corners, scene_corners, H);

//-- Draw lines between the corners (the mapped object in the scene - image_2 )
line( img_matches, scene_corners[0] , scene_corners[1] , Scalar(0, 255, 0), 4 );
line( img_matches, scene_corners[1], scene_corners[2], Scalar( 0, 255, 0), 4 );
line( img_matches, scene_corners[2] , scene_corners[3], Scalar( 0, 255, 0), 4 );
line( img_matches, scene_corners[3] , scene_corners[0], Scalar( 0, 255, 0), 4 );
imshow( "Good Matches & Object detection", img_matches );

}

我收到以下输出

enter image description here

和 std :: cout&lt;&lt; scene_corners [i](结果)

std::cout << scene_corners[i] (Result)

H的价值:

enter image description here

但我的问题是为什么它没有在对象上绘制矩形,如:

Rectangle is visible on detected object

我在简单的视频和图像上这样做,但是当我在静态相机上做到这一点时,如果没有那个矩形可能很难

4 个答案:

答案 0 :(得分:7)

首先,在您显示的图像中,根本不绘制任何矩形。你可以在图像中间绘制一个矩形吗?

然后,查看以下代码:

int x1 , x2 , y1 , y2 ;
x1 = scene_corners[0].x + Point2f( img_1.cols, 0).x ; 
y1 = scene_corners[0].y + Point2f( img_1.cols, 0).y ; 
x2 = scene_corners[0].x + Point2f( img_1.cols, 0).x + in_box.width ; 
y2 = scene_corners[0].y + Point2f( img_1.cols, 0).y + in_box.height ;

我不明白为什么要在每个角落添加in_box.widthin_box.height(他们在哪里定义?)。您应该使用scene_corners[2]代替。但是评论的行应该在某处打印一个矩形。

由于您要求了解更多详细信息,请查看代码中发生的情况。

首先,您如何到达perspectiveTransform()

  1. 使用detector.detect检测要素点。它为您提供了两个图像的兴趣点。
  2. 您使用extractor.compute 描述这些功能。它为您提供了一种比较兴趣点的方法。比较两个特征的描述符可以回答这个问题:这些点有多相似?*
  3. 您实际上将第一张图像上的每个特征与第二张图像中的所有特征(排序)进行比较,并保持每个特征的最佳匹配。此时,您知道看起来最相似的功能对。
  4. 您只保留good_matches。因为对于一个特征,其他图像中最相似的特征实际上完全不同(因为你没有更好的选择,它仍然是最相似的)。这是删除错误匹配的第一个过滤器。
  5. 您会找到与您找到的匹配项对应的单应变换。这意味着您尝试查找第一张图像中的点应该如何投影到第二张图像中。然后,您获得的单应矩阵允许您在第二个图像中投影第一个图像的任意点。
  6. 其次,你用它做什么?

    现在变得有趣了。 您有一个单应矩阵,可以将第一张图像的任意点投影到第二张图像中的对应关系。因此,您可以决定在对象周围绘制一个矩形(即obj_corners),并将其投影到第二个图像(perspectiveTransform( obj_corners, scene_corners, H);)上。结果在scene_corners

    现在您想使用scene_corners绘制一个矩形。但还有一点:drawMatches()显然会将您的两张图片放在img_matches中。但投影(单应矩阵)是分别在图像上计算的!这意味着必须相应地翻译每个scene_corner。由于场景图像是在对象图像的右侧绘制的,因此您必须将对象图像的宽度添加到每个scene_corner,以便将它们转换为右侧。

    这就是您将0添加到y1y2的原因,因为您不必垂直翻译它们。但对于x1x2,您必须添加img_1.cols

    //-- Draw lines between the corners (the mapped object in the scene - image_2 )
    line( img_matches, scene_corners[0] + Point2f( img_1.cols, 0), scene_corners[1] + Point2f( img_1.cols, 0), Scalar(0, 255, 0), 4 );
    line( img_matches, scene_corners[1] + Point2f( img_1.cols, 0), scene_corners[2] + Point2f( img_1.cols, 0), Scalar( 0, 255, 0), 4 );
    line( img_matches, scene_corners[2] + Point2f( img_1.cols, 0), scene_corners[3] + Point2f( img_1.cols, 0), Scalar( 0, 255, 0), 4 );
    line( img_matches, scene_corners[3] + Point2f( img_1.cols, 0), scene_corners[0] + Point2f( img_1.cols, 0), Scalar( 0, 255, 0), 4 );
    

    所以我建议您取消注释这些线条并查看是否绘制了一个矩形。如果没有,请尝试对值进行硬编码(例如Point2f(0, 0)Point2f(100, 100)),直到成功绘制矩形。也许您的问题来自于cvPointPoint2f的使用。另请尝试使用Scalar(0, 255, 0, 255) ...

    希望它有所帮助。

    *必须明白,两点可能看起来完全相同,但不符合现实中的相同点。想想一个真正重复的模式,比如建筑物上的窗户角落。所有窗口看起来都一样,所以两个不同窗口的角落可能看起来非常相似,即使这显然是错误的匹配。

答案 1 :(得分:2)

您执行了以下步骤:

  1. 匹配2张图片中的关键点。
  2. 假设匹配正确,请计算单应性(投影矩阵)。
  3. 使用单应性投影原始图像的角以绘制四边形形状(在下面称为矩形)透视变换。
  4. 您遇到的问题是,当步骤1失败时,您会在步骤2中得到错误的单应性(错误的矩阵),并且当您在步骤3中投影角落时,它们可能会脱离图像而您看不到线。

    您真正想要的是一种了解您计算出的单应性是否正确形式的方法。为此,请在此处查看答案:How to check if obtained homography matrix is good? 用它来测试你的单应性是否正确。如果没有,您知道匹配导致失败。如果它是正确的,你可以绘制一个矩形,你会看到它,但如果关键点之间的匹配不准确,它可能不那么准确。

    最后,我认为你的算法方法是错误的。通过从正面视图将车辆图像与车辆图像匹配来从顶视图识别/检测车辆是死路一条。 你根本不应该使用匹配点。只需手动标记图像上的所有车辆并将其发送到SVM。如果这是太多工作,请使用Mechanical Turk平台自动标记车辆。 总之 - 关键点匹配是一种不适合您需求的方法,因为它有一个强烈的假设,即两个图像中汽车的外观是相似的。在您的情况下,这些图像太不同(由于汽车的3D结构和不同的视角)

答案 2 :(得分:1)

您实际做的是在图像中找到参考点(关键点)并将它们相互比较,以发现它们在另一个图像中重新出现(基于SURF特征向量)。这是对象检测和识别中的一个重要步骤,但不要误以为图像分割(http://en.wikipedia.org/wiki/Image_segmentation)或对象定位,您可以在其中找到所需对象的精确轮廓(或像素或超像素集)。

获取对象的边界矩形,尤其是在示例中放入透视图的矩形,这不是一项简单的任务。您可以从找到的关键点边界框开始。但是,这只会覆盖部分对象。特别是如果没有图像的3D配准,即在知道图像中每个像素的第三维值(z值,深度)时,您的示例中的透视边界框可能很难找到。

答案 3 :(得分:1)

与此相同? Drawing rectangle around detected object using SURF

据我所知,未绘制轮廓的唯一原因是因为执行此操作的代码部分已注释掉,因此取消注释。这部分代码为我概述了一个测试图像:

/*   
//-- Draw lines between the corners (the mapped object in the scene - image_2 )
line( img_matches, scene_corners[0] + Point2f( img_1.cols, 0), scene_corners[1] + Point2f( img_1.cols, 0), Scalar(0, 255, 0), 4 );
line( img_matches, scene_corners[1] + Point2f( img_1.cols, 0), scene_corners[2] + Point2f( img_1.cols, 0), Scalar( 0, 255, 0), 4 );
line( img_matches, scene_corners[2] + Point2f( img_1.cols, 0), scene_corners[3] + Point2f( img_1.cols, 0), Scalar( 0, 255, 0), 4 );
line( img_matches, scene_corners[3] + Point2f( img_1.cols, 0), scene_corners[0] + Point2f( img_1.cols, 0), Scalar( 0, 255, 0), 4 );   */

您可能不希望在视频图像中的匹配模板周围绘制一个矩形,因为它可能会变形。相反,用线条连接扭曲的scene_corners。我会删除所有x1, x2, y1, y2cvRect square内容。

请注意,scene_corners不会为您提供矩形,因为对象可能在视频中的旋转方式与模板图像中的旋转方式不同。上面张贴的手机图片就是一个很好的例子 - 手机屏幕周围的绿色轮廓是一个四边形。如果要使用包含整个对象的矩形ROI,可以考虑查找包含视频中整个对象的边界矩形。我就是这样做的:

// draw the *rectangle* that contains the entire detected object (a quadrilateral)
// i.e. bounding box in the scene (not the corners)

// upper left corner of bounding box
cv::Point2f low_bound = cv::Point2f( min(scene_corners[0].x, scene_corners[3].x) , min(scene_corners[0].y, scene_corners[1].y) );

// lower right corner of bounding box
cv::Point2f high_bound = cv::Point2f( max(scene_corners[2].x, scene_corners[1].x) , max(scene_corners[2].y, scene_corners[3].y) );

// bounding box offset introduced by displaying the images side-by-side
// *only for side-by-side display*
cv::Point2f matches_offset = cv::Point2f( img_1.cols, 0);

// draw the bounding rectangle in the side-by-side display
cv::rectangle( img_matches , low_bound +  matches_offset , high_bound + matches_offset , cv::Scalar::all(255) , 2 );

/* 
if you want the rectangle around the object in the original video images, don't add the
offset and use the following line instead:

cv::rectangle( img_matches , low_bound , high_bound , cv::Scalar::all(255) , 2 );
*/

// Here is the actual rectangle, you can use as the ROI in you video images:
cv::Rect video_rect = cv::Rect( low_bound , high_bound );

上面代码块中的最后一行可能包含您尝试在原始发布的代码中获取的矩形。它应该是视频图像中的矩形img。您可以使用它来处理包含对象的图像子集(ROI)。

正如Anum所说,你也在混合使用新旧OpenCV风格。您可以通过始终使用Point2f而不是cvPoint来清理事物。