我正在使用Google Cloud Vision API中的“ DOCUMENT_TEXT_DETECTION”选项。
似乎返回正确的文本值,但坐标边界框不正确。
为什么会出现此问题?
谢谢。
答案 0 :(得分:0)
DOCUMENT_TEXT_DETECTION用于密集文本,我建议对该图像使用TEXT_DETECTION。
答案 1 :(得分:0)
我使用DOCUMENT_TEXT_DETECTION模型,并且遇到相同的问题。
符号级边界框非常偏移,与其他符号重叠。 即使OCR表现出色并且能够找到匹配的角色,这也是... 请参阅所附图片以获取插图。 (在这种简单的情况下,OCR结果是完美的):
我注意到该模型已经按照https://cloud.google.com/vision/docs/release-notes#May_15_2020成为旧版,也许替代品在此方面做得更好。