应用错误收集

时间：2017-05-21 10:19:18

标签： opencv image-processing ocr tesseract dpi

我正在开发一个项目，用于识别名片中的文本并将它们映射到适当的字段。我正在使用opencv进行图像处理。我需要将预处理后的图像提供给Tesseract-OCR引擎进行文本识别。{{3} } 声明图像应至少具有300的DPI。我的图像像素大小为2560x1536，具有72 DPI。

如何将DPI提高到300？
还有人说，调整图像大小是有益的。如何最佳地调整图像大小以获得良好的OCR结果
Tesseract最适用于DPI至少为300 dpi的图像，因此调整图像大小可能会有所帮助。什么＆＃39; so＆＃39;在这里暗示。调整图像大小和DPI之间的关系是什么？

答案 0 :(得分：3)

对于OCR，真正重要的是分辨率，以像素为单位。因为物理特征可以从微小到巨大，与采集设备的DPI无关。

根据经验，行程宽度约为3像素是一个良好的开端。如果较低，则调整大小可能没有用，因为缺少信息。如果更高，运行时间可能过长（或者OCR功能无法处理它）。

如果存在不匹配，还要根据自己的笔画宽度假设和标题中存储的DPI信息检查包是否内部不会尝试调整大小。