您好我正在尝试使用OCR tesseract识别图像中的某些字母。
我使用imagemagick进行转换,图像似乎很好,但还不够
原始图片:
与imagemagick一起使用的命令转换
contextlib
结果图片:
OCR tesseract命令:
convert input.jpg -fuzz 50% -fill black -opaque black -bordercolor white -border 2 -fill black -draw "color 0,0 floodfill" -alpha off -negate -units pixelsperinch -density 72 output.jpg
输出/结果:
文字:AUGU - > AUOU
Tesseract开源OCR引擎v4.00.00alpha与Leptonica 第1页
文字:VEGU - > VOR-OU
Tesseract开源OCR引擎v4.00.00alpha与Leptonica 第1页
文字:EGUV - > E6UV
Tesseract开源OCR引擎v4.00.00alpha与Leptonica 第1页
文字:USEA - > USSOEA
答案 0 :(得分:0)
不确定这是不是纯粹的运气,因为你只提供了一个单独的图像进行测试,但是我注意到你使用了嘈杂/模糊的JPEG而不是一个干净的PNG,所以我将你的图像设定为50%和制作了它的PNG,它正确识别所有四个字母:
convert yourImage.jpeg -threshold 50% clean.png
tesseract -psm 7 clean.png out