Computer Vision API提供至少两种获取图像标签的方法。
根据the documentation,有"说明"的标签列表,以及顶级"标签"名单。 "标签" list还包含置信度," description标签"列表没有。
然而,描述标签列表似乎比顶级标签列表更详尽,通常显示标签的5到10倍。
为什么有两个不同的标签列表以及每个列表的用例是什么? 此外,有没有理由说明标签列表显示的标签比顶级标签列表更多?
凭直觉我期待相反的情况,即描述基于主要标签列表的标签子集
"description": {
"tags": [
"person",
"man",
"outdoor",
"window",
"glasses",
[...]
],
---------
"tags": [
{
"name": "person",
"confidence": 0.98979085683822632
},
{
"name": "man",
"confidence": 0.94493889808654785
}
答案 0 :(得分:1)
尽管今天的列表类似,但现在或将来都无法保证这些列表保持这种方式。描述中的标签的想法是,如果对自然语言句子的置信度较低,则API用户可以选择使用这些标签构建他们喜欢的句子。
请注意,在tags和description.tags两种情况下,这些术语都是降序置信度。
答案 1 :(得分:0)
但为什么这些标签有置信度,但是说明标签不是?
另外我在一个回复中注意到他们有不同的第四个元素。