我正在开发一种算法,可以找到物体离相机最近的点。我通过使用meanshift在线找到了一些帮助。我已经粘贴了代码来做到这一点。代码的工作原理是:它使用track_window来跟踪最近的对象。但问题是我不知道如何找到最近物体的位置。 我尝试过的: 我可以让track_window通过完整的图像,从而缩小感兴趣的区域,但它太长,我仍然不知道确切的位置。 有人可以帮我找到相机的关闭对象吗? 这是我的代码:
/*
* back_project.cpp
*
* Created on: Mar 8, 2015
* Author: sushrut
*/
#include "backProject.h"
using namespace cv;
using namespace std;
/// Global Variables
Mat src; Mat hsv; Mat hue;
int bins = 25;
Rect track_window = cv::Rect(250, 250, 50, 50);
int x=1, y=1, wr=1, hr=1;
/// Function Headers
void Hist_and_Backproj(int, void* );
/** @function main */
int back_proj_main()
{
VideoCapture cap(0);
if(!cap.isOpened())
{
cout << "Cannot open the first web cam" << endl;
return -1;
}
while(true)
{
Mat src;
bool bSuccess = cap.read(src);
if(!bSuccess)
{
cout << "Cannot read a frame from video stream 1" << endl;
break;
}
/// Transform it to HSV
cvtColor( src, hsv, CV_BGR2HSV );
/// Use only the Hue value
hue.create( hsv.size(), hsv.depth() );
int ch[] = { 0, 0 };
mixChannels( &hsv, 1, &hue, 1, ch, 1 );
/// Create Trackbar to enter the number of bins
char* window_image = "Source image";
namedWindow( window_image, CV_WINDOW_AUTOSIZE );
createTrackbar("* Hue bins: ", window_image, &bins, 180, Hist_and_Backproj );
Hist_and_Backproj(0, 0);
// create a rectangle on the image
rectangle(src, Point(x,y), Point(x+wr, y+hr), Scalar(0, 250, 0));
/// Show the image
imshow( window_image, src );
if (waitKey(30) == 27) //wait for 'esc' key press for 30ms. If 'esc' key is pressed, break loop
{
cout << "esc key is pressed by user" << endl;
break;
}
}
// TODO release the capture
return 0;
}
/**
* @function Hist_and_Backproj
* @brief Callback to Trackbar
*/
void Hist_and_Backproj(int, void* )
{
MatND hist;
int histSize = MAX( bins, 2 );
float hue_range[] = { 0, 180 };
const float* ranges = { hue_range };
/// Get the Histogram and normalize it
calcHist( &hue, 1, 0, Mat(), hist, 1, &histSize, &ranges, true, false );
normalize( hist, hist, 0, 255, NORM_MINMAX, -1, Mat() );
/// Get Backprojection
MatND backproj;
calcBackProject( &hue, 1, 0, hist, backproj, &ranges, 1, true );
/// Draw the backproj
imshow( "BackProj", backproj );
// code to create a meanshift
meanShift(backproj,track_window, TermCriteria(TermCriteria::COUNT|TermCriteria::EPS, 10, 1));
// update the value of recctange
x = track_window.x;
y = track_window.y;
wr = track_window.width;
hr = track_window.height;
cout << "values: " << x << ", " << y << ", " << wr << ", " << hr << endl;
/// Draw the histogram
int w = 400; int h = 400;
int bin_w = cvRound( (double) w / histSize );
Mat histImg = Mat::zeros( w, h, CV_8UC3 );
for( int i = 0; i < bins; i ++ )
{ rectangle( histImg, Point( i*bin_w, h ), Point( (i+1)*bin_w, h - cvRound( hist.at<float>(i)*h/255.0 ) ), Scalar( 0, 0, 255 ), -1 ); }
imshow( "Histogram", histImg );
}
答案 0 :(得分:0)
通常,如果您只有一个帧和一个摄像机 - 对象相对位置,则无法检测哪个对象最接近摄像机。 您应该处理视频序列并跟踪要素点,以确定摄像机坐标系中对象的位置。
您应该研究多视图几何体上的一些材质。例如,YouTube上教授Daniel Cremers的讲座。 Hartley和Zisserman的一本书也非常好。
阅读评论后更新
目前还不清楚你的意思。它们是图像中对象的像素坐标还是3D欧几里德空间中的点?
如果是第一个,那么您可以继续以下操作。 Backproject返回一个图像,其中每个像素包含属于该对象的概率。您可以对此图像进行阈值处理以抛出非常低的概率,从噪声中过滤结果,使用形态运算符(侵蚀,关闭)进行细化,从而获得一个像素的斑点,最可能属于您的对象。然后你可以找到它的边界矩形。如果您不想使用backproject,因为它并不总是找到该对象,那么您可以使用OpenCV中的2D feature detectors and matchers。他们可以估计一些&#34;极端&#34;的位置。点,属于对象。
在第二种情况下,任务看起来像SLAM(同时本地化和映射)的任务。这是一个更复杂的主题。我再次引用您到多视图几何和SLAM课程。此任务还大量使用2D特征点。