Google Cloud Vision API DOCUMENT_TEXT_DETECTION返回错误的边界框

时间：2018-09-21 09:42:34

标签： ocr google-cloud-vision

我正在使用Google Cloud Vision API中的“ DOCUMENT_TEXT_DETECTION”选项。

似乎返回正确的文本值，但坐标边界框不正确。

为什么会出现此问题？

谢谢。

原始图片

绘制边框图片

返回json

附录

绘制边界框单词和整体

2 个答案:

答案 0 :(得分：0)

DOCUMENT_TEXT_DETECTION用于密集文本，我建议对该图像使用TEXT_DETECTION。

答案 1 :(得分：0)

我使用DOCUMENT_TEXT_DETECTION模型，并且遇到相同的问题。

符号级边界框非常偏移，与其他符号重叠。即使OCR表现出色并且能够找到匹配的角色，这也是... 请参阅所附图片以获取插图。（在这种简单的情况下，OCR结果是完美的）：

我注意到该模型已经按照https://cloud.google.com/vision/docs/release-notes#May_15_2020成为旧版，也许替代品在此方面做得更好。