我正在使用ImageMagick将数字化PDF文件转换为tiff。我使用Tesseract扫描这个文档的一小部分,这是一个数字。 我的数字化文档的定义很差,有时tesseract无法读取正确的数字。例如,它显示为:5550002845,您可以在图片中看到该数字。
此图片是使用以下命令从PDF中提取的:
convert -quality 100 -density 300 temp.pdf -depth 8 -colorspace gray +matte +contrast +contrast temp.tiff
我能做些什么来提高图像质量(Tesseract检测)?
此致
答案 0 :(得分:0)
-noise 7为这一个做了诀窍