我可以告诉Google Cloud愿景隔离它在图像中读取的最大(字体大小)文本吗?

时间:2016-07-30 21:55:30

标签: image-recognition google-cloud-vision

我想使用云视觉来识别和隔离"主要"图片中的文字(比如说包装上最大的文字)。我假设云视觉能够通过查看字体大小/每个字母占用多少像素来在后端执行此操作,但我不确定API中是否有输出。

我最好猜测此信息在文档中的位置位于以下链接,但我看不到与此相关的任何内容:https://cloud.google.com/natural-language/reference/rest/v1beta1/documents/annotateText

1 个答案:

答案 0 :(得分:1)

TEXT_DETECTION Vision API (https://cloud.google.com/vision/docs/samples#detecting_text_in_images) 可以返回(string + boundingPoly)的数组。

json表示AnnotateImageResponse位于下方。

"textAnnotations": [
    {
      object(EntityAnnotation)
    }
  ]

EntityAnnotation https://cloud.google.com/vision/reference/rest/v1/images/annotate#EntityAnnotation

您可以从BoundingPoly获取字体大小(以像素为单位) https://cloud.google.com/vision/reference/rest/v1/images/annotate#BoundingPoly