Tesseract在带有粗体文本的图像上进行OCR

时间:2017-03-26 15:43:05

标签: opencv tesseract

我正在努力从文本粗体的图像中获取文本。我在这里附上了图片。Original Image

我使用OpenCV颠倒了图像的颜色,并将其更改为Inverted color

我希望tesseract给出5作为文本输出,但我得到一个空值。

包含多行文字的图片。未使用psm 7,8或9提取此图像中的数据。 Multiline text image

1 个答案:

答案 0 :(得分:1)

可以通过将psm设置为789来识别这两种图像。如果您使用的是3.x.x,建议使用Tesseract 4.0.0 alpha来改善OCR结果,并使用--psm 9

Page segmentation mode:
  7    Treat the image as a single text line.
  8    Treat the image as a single word.
  9    Treat the image as a single word in a circle.

希望得到这个帮助。

修改

关于您在运行中确定要使用哪个psm的其他问题,您可以检查图像高度以确定要使用的psm值。

例如,5的高度为80,fox消息的高度为480.使用像素值,可以更轻松地实现代码来设置psm值。