扫描文件的最佳设置是什么?扫描文档(白色和黑色文本)并将其用于OCR转换(以获得最佳效果)以及PDF和TIFF格式的标准设置和规范是什么?
答案 0 :(得分:2)
对于OCR,最佳扫描设置为:
某些OCR技术可能有特殊的偏好,这可能会有所帮助,但它们通常很小。
答案 1 :(得分:1)
出于OCR目的,我会以300DPI,B / W或灰度以及未压缩的TIFF或PNG格式扫描文档。
答案 2 :(得分:0)
虽然300DPI最适合"完美"输入,如果你使用不完美的输入(例如从打字机或点阵打印机),那么高分辨率实际上会抛出tesseract。在这种情况下,最好使用较低的分辨率来隐藏瑕疵。例如。使用点阵打印机,我在150dpi时的效果明显优于300dpi。
答案 3 :(得分:0)
如果你想得到一般答案,300 DPI是好的。通常用于黑白图像的最佳OCR结果,如果您的图像质量较低,您可以通过应用图像处理来改善它。
另外,如果要保存扫描图像然后将其送入OCR引擎,请不要使用像JPEG这样的有损压缩。请注意,存在无损JPEG压缩,但通常不支持。