Question

您好我正在尝试使用OCR tesseract识别图像中的某些字母。

我使用imagemagick进行转换，图像似乎很好，但还不够

原始图片：

与imagemagick一起使用的命令转换

contextlib

结果图片：

OCR tesseract命令：

convert input.jpg -fuzz 50% -fill black -opaque black -bordercolor white -border 2 -fill black -draw "color 0,0 floodfill" -alpha off -negate -units pixelsperinch -density 72 output.jpg

输出/结果：

文字：AUGU - ＆gt; AUOU

Tesseract开源OCR引擎v4.00.00alpha与Leptonica 第1页

文字：VEGU - ＆gt; VOR-OU

Tesseract开源OCR引擎v4.00.00alpha与Leptonica 第1页

文字：EGUV - ＆gt; E6UV

Tesseract开源OCR引擎v4.00.00alpha与Leptonica 第1页

文字：USEA - ＆gt; USSOEA

Answer 1

不确定这是不是纯粹的运气，因为你只提供了一个单独的图像进行测试，但是我注意到你使用了嘈杂/模糊的JPEG而不是一个干净的PNG，所以我将你的图像设定为50％和制作了它的PNG，它正确识别所有四个字母：

convert yourImage.jpeg -threshold 50% clean.png
tesseract -psm 7 clean.png out

Tesseract简单图像与文本识别，帮助想要转换/转换图像

1 个答案: