我已经使用Google视觉OCR已有一段时间了。而且我观察到OCR结果随图像尺寸而变化。举例来说,尺寸为720 x 1280的图像比360 x 720的图像效果更好。反之,有时效果会更差。
我在使用Microsoft的OCR API时也遇到了同样的情况。
那么,是否存在一个理想的图像尺寸始终可以带来良好的OCR结果?图像尺寸如何影响OCR结果?
答案 0 :(得分:0)
图像尺寸不会系统地影响OCR结果。但是,影响OCR质量结果的因素是文档分辨率(dpi)。使用300 dpi可获得Typically的最佳效果。低于70dpi会变得困难。我的猜测是,随着文档尺寸的改变,您也间接地改变了dpi。
答案 1 :(得分:0)
请参考以下信息:Google Supported images
FACE_DETECTION 1600 x 1200 眼睛之间的距离最重要
LANDMARK_DETECTION 640 x 480
LOGO_DETECTION 640 x 480
LABEL_DETECTION 640 x 480
TEXT_DETECTION和DOCUMENT_TEXT_DETECTION 1024 x 768 OCR需要更多 字符检测分辨率
SAFE_SEARCH_DETECTION 640 x 480
答案 2 :(得分:0)
基于下面的链接,不仅是分辨率,而且长宽比也是一个因素 https://www.mlreader.com/prepare-image-for-google-vision-api