训练Haar分类器以检测字母/数字

时间:2019-03-12 03:44:21

标签: opencv ocr

我有一个带有圈出答案的测试答题纸,我正在尝试使用OpenCV检测数字/字母。我使用10x10的“ 2”图像作为正面图像,并使用答题纸的其他44个部分作为负面图像来自己创建Haar分类器。

显然,我做错了什么,因为我的分类器无法检测到原始的“ 2”。

$opencv_createsamples -vec a_desc.bin -info positive.txt -bg negative.txt -num 1 -w 10 -h 10

$opencv_traincascade -data classifiers -vec a_desc.bin -bg negative.txt -numStages 20 -numPos 1 -numNeg 46 -w 10 -h 10
....

    ===== TRAINING 4-stage =====
    <BEGIN
    POS count : consumed   1 : 1
    NEG count : acceptanceRatio    0 : 0
    Required leaf false alarm rate achieved. Branch training terminated.

我做错了什么

  • 收费否定
  • 肯定太少
  • 底片和底片的大小必须匹配
  • 所有图像必须使用相同的格式(png | jpg | gif)

基本上,对以下方法的期望是什么:

  1. 从随机书中选择一个页面
  2. 我们创建“ e”字母的10x10图像
  3. 我们创建了20个其他字母/数字的底片图像
  4. 我们使用这两个数据集创建分类器
  5. 现在,我们尝试对原始页面进行分类。

我们应该找到所有出现的'e'和一些误报吗?

0 个答案:

没有答案