图像分辨率较差的tesseract

时间:2012-02-21 22:33:10

标签: image-processing ocr tesseract

我正在运行fedora 11。

我试图找出指示卫星图像上日期的字符,但其分辨率(故意?)恶化。

目标是自动化此过程。为此,我使用ocr程序 tesseract

它可以在我的电脑上完美地进行扫描,但在这种情况下它不起作用。

这就是我的所作所为:

图片地址:

http://www.meteo.pf/bulletins/satellites/societeir.jpg

我转换为tiff格式(由tesseract, (bpp ok)使用)

我使用tesseract:tesseract societeir.tif test,但没有输出。

当我增加图片缩放时,ocr在线工作,但tesseract没有。

你有什么建议吗?

2 个答案:

答案 0 :(得分:1)

一个建议,

由于图像上的日期很可能位于相同的位置且尺寸相同,因此您可以尝试将其剪切掉并使用图像处理工具将其另存为另一个图像。我通常会使用gimp,但leptonica,imagemagick是我能想到的其他工具。新图像的识别应该更好

答案 1 :(得分:0)

将日期区域复制到内存中,对其运行增强功能然后针对它运行OCR吗?