为什么OpenCV仅在训练图像中识别对象?

时间:2016-02-03 16:36:30

标签: c++ opencv detection opencv3.0 lbph-algorithm

为了让我的iOS应用识别1€,2€和0.50€硬币,我一直在尝试使用opencv_createsamplesopencv_traincascade来创建我自己的classifier.xml。所以,我从一个短视频裁剪了60张2欧元硬币的图像,如下所示:

enter image description here

然后,我使用opencv_createsamples将它们与随机背景相结合。我获得了12000张类似于此的图像:

enter image description here

我运行了以下命令:

opencv_createsamples -img positives/i.jpg -bg negatives.txt -info i.txt -num 210 -maxidev 100 -maxxangle 0.0 -maxyangle 0.0 -maxzangle 0.9 -bgcolor 0 -bgthresh 0 -w 48 -h 48(对于i从0到60)

cat *.txt > positives.txt

opencv_createsamples -info positives.txt -bg negatives.txt -vec 2.vec -num 12600 -w 48 -h 48

opencv_traincascade -data final -vec 2.vec -bg negatives.txt -numPos 12000 -numNeg 3000 -numStages 20 -featureType LBP -precalcValBufSize 2048 -precalcIdxBufSize 2048 -minHitRate 0.999 -maxFalseAlarmRate 0.5 -w 48 -h 48

训练在第13阶段停止。获得cascade.xml后,我在智能手机拍摄的简单图像上立即尝试了detectMultiScale(),但未检测到任何内容:

enter image description here

如果我将其中一个用作训练的图像作为输入,那么它的效果非常好:

enter image description here

我真的不明白为什么会发生这种情况并且它让我疯了,最重要的是因为我一直试图让它运作数周...你能告诉我我在哪里犯了错吗?

我写的简短程序在这里:

#include "opencv2/opencv.hpp"

using namespace cv;

int main(int, char**) {

Mat src = imread("2b.jpg");

Mat src_gray;

std::vector<cv::Rect> money;

CascadeClassifier euro2_cascade;

cvtColor(src, src_gray, CV_BGR2GRAY );
equalizeHist(src_gray, src_gray);

if ( !euro2_cascade.load( "cascade.xml" ) ) {
    printf("--(!)Error loading\n");
    return -1;
}

euro2_cascade.detectMultiScale( src_gray, money, 1.1, 3, 0|CASCADE_SCALE_IMAGE/*CV_HAAR_FIND_BIGGEST_OBJECT | CV_HAAR_SCALE_IMAGE*/, cv::Size(10, 10),cv::Size(2000, 2000) );
printf("%d\n", int(money.size()));

for( size_t i = 0; i < money.size(); i++ ) {
    cv::Point center( money[i].x + money[i].width*0.5, money[i].y + money[i].height*0.5 );
    ellipse( src, center, cv::Size( money[i].width*0.5, money[i].height*0.5), 0, 0, 360, Scalar( 255, 0, 255 ), 4, 8, 0 );
}

namedWindow( "Display window", WINDOW_AUTOSIZE );
imwrite("result.jpg",src);
}

我还尝试将feature homography用于我的OpenCV 3.1版。因此,我为我的版本下载了opencv_contrib并尝试编译xfeatures2d模块,但我在CMakeList文件中出现了CMake错误...而且xfeature2d甚至不存在于xcc的opencv框架内,所以即使我在我的电脑上工作也可以不要在iOS中使用它......

更新

据我所知,我刚刚尝试删除了equalizeHist(src_gray, src_gray);,并且我在detectMultiScale()``中设置了邻居的数量,这就是我得到的:

enter image description here

更新2

正如有人建议的那样,在this教程后,我刚刚使用裁剪后的正片创建了一个.vec文件,只有硬币。我用了这个命令:

opencv_createsamples -vec i.vec -w 48 -h 48 -num 210 -img ./positives/i.jpg -maxidev 100 -maxxangle 0 -maxyangle 0 -maxzangle 0.9 -bgcolor 0 -bgthresh 0 (对于i从0到60)

正如您所看到的,没有用于创建样本的背景图像。 然后,在下载mergevec.py之后,我将所有矢量文件组合在一起。现在我要开始另一场LBP培训...我希望它能更好地运作

2 个答案:

答案 0 :(得分:1)

你的级联没有经过适当的训练。 您不仅要为硬币添加不同的背景,还要为3个角度添加不同的比例和不同的旋转。 还要为训练添加更多的指标(你有很多小的探测意味着,级联没有接受负面训练)

答案 1 :(得分:1)

这可能是由于缺乏代表可能案例总体情况的培训数据的原因。您没有向模型表示完整信息。如果您没有更多数据,

  1. 你应该旋转图像,以随机大小和角度裁剪它们,翻转(沿垂直边缘镜像)基本上数据增强
  2. 您可以执行背景分离,然后使用模型进行分类
  3. 将图像转换为grey scale,然后操作分类模型(有时颜色可能误导模型)