ImageMagick预处理tesseract-ocr的图像

时间:2014-02-27 00:36:22

标签: image-processing imagemagick ocr tesseract

无论如何使用ImageMagick处理像this这样的图像,以便我可以使用tesseract-ocr将其转换为文本吗?

由于背景中的线条,我从传统方法中得到了废话。有谁知道如何处理像这样的图像?

'convert -density 300 -units PixelsPerInch -type Grayscale + compress input.png input.tif'后跟'tesseract input.tif output -l eng'给了我彻底的垃圾。

或者有没有ImageMagick的替代品,我可以用它来预处理这样的图像,无论是通过命令行还是在python中?

1 个答案:

答案 0 :(得分:1)

在将图像转换为灰度后,您是否尝试过形态学操作Morphology of Shapes