Question

我想使用云视觉来识别和隔离＆＃34;主要＆＃34;图片中的文字（比如说包装上最大的文字）。我假设云视觉能够通过查看字体大小/每个字母占用多少像素来在后端执行此操作，但我不确定API中是否有输出。

我最好猜测此信息在文档中的位置位于以下链接，但我看不到与此相关的任何内容：https://cloud.google.com/natural-language/reference/rest/v1beta1/documents/annotateText

Answer 1

TEXT_DETECTION Vision API （https://cloud.google.com/vision/docs/samples#detecting_text_in_images）可以返回（string + boundingPoly）的数组。

json表示AnnotateImageResponse位于下方。

"textAnnotations": [
    {
      object(EntityAnnotation)
    }
  ]