我正在努力从文本粗体的图像中获取文本。我在这里附上了图片。
我使用OpenCV颠倒了图像的颜色,并将其更改为
我希望tesseract给出5作为文本输出,但我得到一个空值。
包含多行文字的图片。未使用psm 7,8或9提取此图像中的数据。
答案 0 :(得分:1)
可以通过将psm
设置为7
,8
或9
来识别这两种图像。如果您使用的是3.x.x,建议使用Tesseract 4.0.0 alpha来改善OCR结果,并使用--psm 9
。
Page segmentation mode:
7 Treat the image as a single text line.
8 Treat the image as a single word.
9 Treat the image as a single word in a circle.
希望得到这个帮助。
修改强>
关于您在运行中确定要使用哪个psm的其他问题,您可以检查图像高度以确定要使用的psm
值。
例如,5
的高度为80,fox
消息的高度为480.使用像素值,可以更轻松地实现代码来设置psm
值。