通过Google视觉获得更好的OCR的理想图像尺寸是多少?

时间:2018-11-02 10:58:30

标签: image-processing ocr microsoft-cognitive google-vision image-preprocessing

我已经使用Google视觉OCR已有一段时间了。而且我观察到OCR结果随图像尺寸而变化。举例来说,尺寸为720 x 1280的图像比360 x 720的图像效果更好。反之,有时效果会更差。

我在使用Microsoft的OCR API时也遇到了同样的情况。

那么,是否存在一个理想的图像尺寸始终可以带来良好的OCR结果?图像尺寸如何影响OCR结果?

3 个答案:

答案 0 :(得分:0)

图像尺寸不会系统地影响OCR结果。但是,影响OCR质量结果的因素是文档分辨率(dpi)。使用300 dpi可获得Typically的最佳效果。低于70dpi会变得困难。我的猜测是,随着文档尺寸的改变,您也间接地改变了dpi。

答案 1 :(得分:0)

请参考以下信息:Google Supported images

FACE_DETECTION 1600 x 1200 眼睛之间的距离最重要

LANDMARK_DETECTION 640 x 480

LOGO_DETECTION 640 x 480

LABEL_DETECTION 640 x 480

TEXT_DETECTION和DOCUMENT_TEXT_DETECTION 1024 x 768 OCR需要更多 字符检测分辨率

SAFE_SEARCH_DETECTION 640 x 480

Google Supported images

答案 2 :(得分:0)

基于下面的链接,不仅是分辨率,而且长宽比也是一个因素  https://www.mlreader.com/prepare-image-for-google-vision-api