如何在tesseract OCR中分隔(间隔)数字

时间:2017-04-28 17:31:07

标签: split numbers ocr tesseract spacing

我试着从中获取数字 image

但在提交我的结果后是2 332223355 1 23,我真的不明白它是如何分裂的,我需要的是用空格分割一个,两个和三个数字的数字。有谁能够帮我?

1 个答案:

答案 0 :(得分:1)

使用:

  

tesseract -psm 7 NXect.png stdout

给出了您提供的图像:

2 3 32 22 33 55 123‘

我正在使用的tesseract版本:

$ tesseract --version
tesseract 3.04.01
 leptonica-1.73
  libgif 5.1.2 : libjpeg 8d (libjpeg-turbo 1.4.2) : libpng 1.2.54 : libtiff 4.0.6 : zlib 1.2.8 : libwebp 0.4.4 : libopenjp2 2.1.0

给了我没有任何选项的原始图片:

Error in pixGenHalftoneMask: pix too small: w = 250, h = 58
23 32 22 33 55 123

和调整大小的图像(2x):

$ tesseract  NXect_x2.png stdout
23 32 22 33 55 123

因此我无法确认您是否正在获取图像的OCR结果。