Google Cloud Vision API DOCUMENT_TEXT_DETECTION返回错误的边界框

时间:2018-09-21 09:42:34

标签: ocr google-cloud-vision

我正在使用Google Cloud Vision API中的“ DOCUMENT_TEXT_DETECTION”选项。

似乎返回正确的文本值,但坐标边界框不正确。

为什么会出现此问题?

谢谢。

原始图片

enter image description here

绘制边框图片

enter image description here

返回json


附录

绘制边界框单词和整体

enter image description here

2 个答案:

答案 0 :(得分:0)

DOCUMENT_TEXT_DETECTION用于密集文本,我建议对该图像使用TEXT_DETECTION

答案 1 :(得分:0)

我使用DOCUMENT_TEXT_DETECTION模型,并且遇到相同的问题。

符号级边界框非常偏移,与其他符号重叠。 即使OCR表现出色并且能够找到匹配的角色,这也是... 请参阅所附图片以获取插图。 (在这种简单的情况下,OCR结果是完美的):

enter image description here

我注意到该模型已经按照https://cloud.google.com/vision/docs/release-notes#May_15_2020成为旧版,也许替代品在此方面做得更好。