Question

我正在努力从文本粗体的图像中获取文本。我在这里附上了图片。 Original Image

我使用OpenCV颠倒了图像的颜色，并将其更改为 Inverted color

我希望tesseract给出5作为文本输出，但我得到一个空值。

包含多行文字的图片。未使用psm 7,8或9提取此图像中的数据。 Multiline text image

Answer 1

可以通过将psm设置为7，8或9来识别这两种图像。如果您使用的是3.x.x，建议使用Tesseract 4.0.0 alpha来改善OCR结果，并使用--psm 9。

Page segmentation mode:
  7    Treat the image as a single text line.
  8    Treat the image as a single word.
  9    Treat the image as a single word in a circle.

希望得到这个帮助。

修改

关于您在运行中确定要使用哪个psm的其他问题，您可以检查图像高度以确定要使用的psm值。

例如，5的高度为80，fox消息的高度为480.使用像素值，可以更轻松地实现代码来设置psm值。

Tesseract在带有粗体文本的图像上进行OCR

1 个答案: