Question

Computer Vision API提供至少两种获取图像标签的方法。

根据the documentation，有＆＃34;说明＆＃34;的标签列表，以及顶级＆＃34;标签＆＃34;名单。＆＃34;标签＆＃34; list还包含置信度，＆＃34; description标签＆＃34;列表没有。

然而，描述标签列表似乎比顶级标签列表更详尽，通常显示标签的5到10倍。

为什么有两个不同的标签列表以及每个列表的用例是什么？此外，有没有理由说明标签列表显示的标签比顶级标签列表更多？

凭直觉我期待相反的情况，即描述基于主要标签列表的标签子集

  "description": {
"tags": [
  "person",
  "man",
  "outdoor",
  "window",
  "glasses",
  [...]
],
---------
"tags": [
{
  "name": "person",
  "confidence": 0.98979085683822632
},
{
  "name": "man",
  "confidence": 0.94493889808654785
}

Answer 1

尽管今天的列表类似，但现在或将来都无法保证这些列表保持这种方式。描述中的标签的想法是，如果对自然语言句子的置信度较低，则API用户可以选择使用这些标签构建他们喜欢的句子。

请注意，在tags和description.tags两种情况下，这些术语都是降序置信度。

Answer 2

但为什么这些标签有置信度，但是说明标签不是？

另外我在一个回复中注意到他们有不同的第四个元素。

Vision API：不同的标签列表

2 个答案: