Tesseract简单图像与文本识别,帮助想要转换/转换图像

时间:2017-07-05 02:43:45

标签: imagemagick ocr tesseract captcha leptonica

您好我正在尝试使用OCR tesseract识别图像中的某些字母。

我使用imagemagick进行转换,图像似乎很好,但还不够

原始图片:

enter image description here

与imagemagick一起使用的命令转换

contextlib

结果图片:

enter image description here

OCR tesseract命令:

convert input.jpg -fuzz 50% -fill black -opaque black -bordercolor white -border 2 -fill black -draw "color 0,0 floodfill" -alpha off -negate -units pixelsperinch -density 72 output.jpg

输出/结果:

文字:AUGU - > AUOU

Tesseract开源OCR引擎v4.00.00alpha与Leptonica 第1页

文字:VEGU - > VOR-OU

Tesseract开源OCR引擎v4.00.00alpha与Leptonica 第1页

文字:EGUV - > E6UV

Tesseract开源OCR引擎v4.00.00alpha与Leptonica 第1页

文字:USEA - > USSOEA

1 个答案:

答案 0 :(得分:0)

不确定这是不是纯粹的运气,因为你只提供了一个单独的图像进行测试,但是我注意到你使用了嘈杂/模糊的JPEG而不是一个干净的PNG,所以我将你的图像设定为50%和制作了它的PNG,它正确识别所有四个字母:

convert yourImage.jpeg -threshold 50% clean.png
tesseract -psm 7 clean.png out