我想使用云视觉来识别和隔离"主要"图片中的文字(比如说包装上最大的文字)。我假设云视觉能够通过查看字体大小/每个字母占用多少像素来在后端执行此操作,但我不确定API中是否有输出。
我最好猜测此信息在文档中的位置位于以下链接,但我看不到与此相关的任何内容:https://cloud.google.com/natural-language/reference/rest/v1beta1/documents/annotateText
答案 0 :(得分:1)
TEXT_DETECTION
Vision API
(https://cloud.google.com/vision/docs/samples#detecting_text_in_images)
可以返回(string + boundingPoly)的数组。
json表示AnnotateImageResponse
位于下方。
"textAnnotations": [
{
object(EntityAnnotation)
}
]
EntityAnnotation
https://cloud.google.com/vision/reference/rest/v1/images/annotate#EntityAnnotation
您可以从BoundingPoly
获取字体大小(以像素为单位)
https://cloud.google.com/vision/reference/rest/v1/images/annotate#BoundingPoly