Google Vision Api文本检测换行符

时间:2018-11-21 16:55:24

标签: google-vision

当我阅读带有文字的图像时,Google Vision会在句子的中间插入换行符。如何避免这种情况。这是图片文字和Google Vision返回值的示例:

图片中的文字:

01 600149 CHICKEN M PR 1 UN X 3.500 (0.11)
02 600019 POTATO M PR 1 UN X 7.50 (0.24)
03 31820 COCA ZERO M PR 1 UN X 10.90 (0.00)

Google视觉回报:

01 600149 CHICKEN M PR
02 600019 POTATO M PR
03 31820 COCA ZERO M PR
1 UN X 3,500 0.11)
1 UN X 7.50 (0.24)
1 UN X 10.90 (0.00)

谢谢

1 个答案:

答案 0 :(得分:0)

您无法真正控制Google如何检测文本框。他们不是同一行,因为他们的文本检测器分别检测到不同的文本框(也许可以获得更好的OCR质量)

您可以做的是检查每个文本框的y位置(在OCR中给出),如果y靠近则将文本放在一起。当然,您应该通过升序x来进行排序,以使文本顺序井井有条。