我一直在测试Google的Vision API,以便将标签贴在不同的图片上。
对于给定的图像,我会得到这样的东西:
"google_labels": {
"responses": [{
"labelAnnotations": [{
"score": 0.8966763,
"description": "food",
"mid": "/m/02wbm"
}, {
"score": 0.80512983,
"description": "produce",
"mid": "/m/036qh8"
}, {
"score": 0.73635191,
"description": "juice",
"mid": "/m/01z1kdw"
}, {
"score": 0.69849229,
"description": "meal",
"mid": "/m/0krfg"
}, {
"score": 0.53875387,
"description": "fruit",
"mid": "/m/02xwb"
}]
}]
}
- >我的问题是:
['produce', 'meal', ...]
)以及我在哪里可以找到它?我猜'不'和'不'因为我找不到任何东西,但是,也许不是。谢谢!
答案 0 :(得分:2)
有一个搜索它们的API,名为 Google Knowledge Graph API :
https://developers.google.com/knowledge-graph/reference/rest/v1/
他们将其链接到 Google Vision API文档:
的底部https://cloud.google.com/vision/docs/labels
修改:更多信息
好吧,以/ g /开头的中间是google实体,以/ m /开头的中间是Freebase标识符,但google kgraph API并不总是返回它们。
这些数据是公开的,可以下载,但数据库中有太多记录,谷歌没有公布他们使用的那些记录。
视觉api中返回的MID示例和维基数据中的记录:
{
desc: "institution",
mid: "/m/01r28c",
score: 72.29216694831848,
confidence: 0,
locations: [ ],
properties: [ ]
},
https://www.wikidata.org/wiki/Q178706
最后一个freebase转储可以在这里下载:
答案 1 :(得分:0)
虽然我无法验证数据库的完整性,但是Google Open Images项目有大约2万个分类的列表。
如果您浏览到download页,则可以下载带有这些描述的列表为CSV。
我检查了CloudVision中的一些参考图像,并得出以下结果:
ID / CloudVision Classification / OpenImages Classification
1. 01ssh5 / Shoulder / Shoulder (Body Part)
2. 09cx8 / Finger / Finger
3. 068jd / Photograph / Photograph
4. 01k74n / Facial expression / Facial expression
5. 04hgtk / Head / Human Head
我能够在CSV中找到具有相同含义的所有ID-因此,作为基本列表,这就足够了。请注意,您应该始终按ID而不是按类别进行匹配,因为有一些细微的变化。
如果您在CloudVision中找到了任何ID,但没有在列表中找到,我很想在评论中知道!