我正在开发一个项目,用于识别名片中的文本并将它们映射到适当的字段。我正在使用opencv进行图像处理。我需要将预处理后的图像提供给Tesseract-OCR引擎进行文本识别。{{3} } 声明图像应至少具有300的DPI。我的图像像素大小为2560x1536,具有72 DPI。
答案 0 :(得分:3)
对于OCR,真正重要的是分辨率,以像素为单位。因为物理特征可以从微小到巨大,与采集设备的DPI无关。
根据经验,行程宽度约为3像素是一个良好的开端。如果较低,则调整大小可能没有用,因为缺少信息。如果更高,运行时间可能过长(或者OCR功能无法处理它)。
如果存在不匹配,还要根据自己的笔画宽度假设和标题中存储的DPI信息检查包是否内部不会尝试调整大小。