ImageMagick对数字可读性的最佳改进(使用Tesseract)

时间:2013-12-20 09:19:06

标签: numbers imagemagick tiff tesseract readability

我正在使用ImageMagick将数字化PDF文件转换为tiff。我使用Tesseract扫描这个文档的一小部分,这是一个数字。 我的数字化文档的定义很差,有时tesseract无法读取正确的数字。例如,它显示为:5550002845,您可以在图片中看到该数字。

enter image description here

此图片是使用以下命令从PDF中提取的:

convert -quality 100 -density 300 temp.pdf -depth 8 -colorspace gray +matte +contrast +contrast temp.tiff

我能做些什么来提高图像质量(Tesseract检测)?

此致

1 个答案:

答案 0 :(得分:0)

-noise 7为这一个做了诀窍