更改图像DPI以便与tesseract一起使用

时间:2017-05-21 10:19:18

标签: opencv image-processing ocr tesseract dpi

我正在开发一个项目,用于识别名片中的文本并将它们映射到适当的字段。我正在使用opencv进行图像处理。我需要将预处理后的图像提供给Tesseract-OCR引擎进行文本识别。{{3} } 声明图像应至少具有300的DPI。我的图像像素大小为2560x1536,具有72 DPI。

  • 如何将DPI提高到300?
  • 还有人说,调整图像大小是有益的。如何最佳地调整图像大小以获得良好的OCR结果
  • Tesseract最适用于DPI至少为300 dpi的图像,因此调整图像大小可能会有所帮助。什么' so'在这里暗示。调整图像大小和DPI之间的关系是什么?

1 个答案:

答案 0 :(得分:3)

对于OCR,真正重要的是分辨率,以像素为单位。因为物理特征可以从微小到巨大,与采集设备的DPI无关。

根据经验,行程宽度约为3像素是一个良好的开端。如果较低,则调整大小可能没有用,因为缺少信息。如果更高,运行时间可能过长(或者OCR功能无法处理它)。

如果存在不匹配,还要根据自己的笔画宽度假设和标题中存储的DPI信息检查包是否内部不会尝试调整大小。