针对ImageMagick压缩图像运行textcleaner

时间:2015-01-07 23:32:53

标签: compression imagemagick ocr tesseract

我正在尝试使用textcleaner脚本来清理我在OCR中使用的真实图像。我遇到的问题是发送给我的图像有时很大。 (3.5mb - 5mb 12MP pics)我使用textcleaner(textcleaner -g -e none -f <int @ 10 - 100> -o 5 result1.jpg out1.jpg)运行的命令在-f 10上花费大约10秒钟,在-f 100上花费几分钟或更长时间。

为了解决这个问题,我尝试使用ImageMagick压缩图像,使其更小。使用convert -strip -interlace Plane -gaussian-blur 0.05 -quality 50% main.jpg result1.jpg我能够获得3.5mb并将它几乎无损转换为~400kb。但是,当我在这个新文件上运行textcleaner时,它仍然像一个3.5mb文件。 (时代几乎完全一样)。我已经针对未压缩@ 400kb的文件测试了这些textcleaner设置,它几乎是即时的,而-f 100大约需要12秒。

我是出于想法。我想按照here示例,因为我处于几乎完全相同的情况。但是,按照目前的转换速度,当我需要大约30秒时,整个OCR过程可能需要10多分钟。

0 个答案:

没有答案