我一直在尝试编写一个识别铅笔帽的应用程序(在这种情况下)。
我一直拍摄了大约40张物体的照片,以及635张没有物体的照片。 然后我一直在使用perl脚本“createsamples.pl”使用此命令从40张正面图片生成3000张正面图像(我还尝试生成1500张图片,结果相同):
createsamples.pl p.dat n.dat output
p.dat是包含40张正片图像名称的文件,n.dat是包含636张负片图像名称的文件。
我一直在将创建的矢量文件合并到一个矢量文件中,然后我一直在尝试像这样开始训练:
opencv_traincascade -data cascades -vec samples.vec -bg n.dat -numPos 1000 -numNeg 635 -numStages 1 -w 20 -h 20 -featureType LBP
这在几秒钟内完成,但当我在我的应用程序中尝试时,却给了我无数的错误检测。
所以我再次试用了更多的舞台,最多20个。
===== TRAINING 19-stage =====
BEGIN
POS count : consumed 2000 : 2302
NEG count : acceptanceRatio 635 : 0.000145818
Precalculation time: 1.487
+----+---------+---------+
| N | HR | FA |
+----+---------+---------+
| 1| 1| 1|
+----+---------+---------+
| 2| 0.997| 0.829921|
+----+---------+---------+
| 3| 0.997| 0.829921|
+----+---------+---------+
| 4| 0.9985| 0.856693|
+----+---------+---------+
| 5| 0.9965| 0.694488|
+----+---------+---------+
| 6| 0.9955| 0.645669|
+----+---------+---------+
| 7| 0.9955| 0.6|
+----+---------+---------+
| 8| 0.996| 0.579528|
+----+---------+---------+
| 9| 0.9955| 0.544882|
+----+---------+---------+
| 10| 0.9955| 0.540157|
+----+---------+---------+
| 11| 0.9955| 0.359055|
+----+---------+---------+
END>
在这个舞台上,我仍然得到了错误的检测,而不是那么多,但它们仍然在那里。
所以我尝试了更多的舞台,最多30个。但是在21阶段的训练中,我已经获得了这个接受率:
===== TRAINING 20-stage =====
BEGIN
POS count : consumed 2000 : 2320
NEG count : acceptanceRatio 635 : 9.72903e-005
Precalculation time: 1.493
+----+---------+---------+
| N | HR | FA |
+----+---------+---------+
| 1| 1| 1|
+----+---------+---------+
| 2| 0.997| 0.831496|
+----+---------+---------+
| 3| 0.997| 0.831496|
+----+---------+---------+
| 4| 0.999| 0.779528|
+----+---------+---------+
| 5| 0.9955| 0.64252|
+----+---------+---------+
| 6| 0.9965| 0.694488|
+----+---------+---------+
| 7| 0.9955| 0.689764|
+----+---------+---------+
| 8| 0.9955| 0.628346|
+----+---------+---------+
| 9| 0.996| 0.645669|
+----+---------+---------+
| 10| 0.9965| 0.541732|
+----+---------+---------+
| 11| 0.9955| 0.43622|
+----+---------+---------+
END>
这个接受率意味着分类器过度训练了吧?至少这是人们在stackoverflow上提到的几个问题。
使用视频捕捉并将物体(铅笔帽)放在相机前面以便检测它。在大多数帧中,它仍然被检测到,但是与盖子位于同一背景上的任何其他物体也会被检测到。
40张正面照片看起来像是:http://i.imgur.com/fOqiyP8.jpg
其中10个是在灰色背景下拍摄的,10个是在红色背景下拍摄的,10个是在银色的背景下拍摄的,10个是在我的键盘上盖上的。总而言之,我的问题是:
1)我使用的40张图片可以使用吗?或根本没有背景?因为现在,当我将我的视频捕捉指向我之前使用的红色背景时,我会得到错误的检测。发生的事情的例子(删除空间请):http://i.imgur.com/w0szcTh.jpg?1
2)我完全没有达到目标吗?
3)我发现最好的教程是关于我尝试的是这个: http://coding-robin.de/2013/07/22/train-your-own-opencv-haar-classifier.html 他的照片也显示了背景,但似乎他没有得到错误的检测。你知道我的方法还有什么问题吗?
先谢谢你们,我希望你们中的任何人都可以帮助我。
答案 0 :(得分:0)
我认为,对于这个问题,颜色检测+轮廓发现应该是更有效的方法。 另请查看http://code.google.com/p/cvblob/。
Haar级联与灰度图像一起使用,并且您的对象没有很多视觉特征,可以将其与其他对象区分开来,这就是为什么您的探测器有大量错误检测的原因。