Question

我一直在测试Google的Vision API，以便将标签贴在不同的图片上。

对于给定的图像，我会得到这样的东西：

"google_labels": {
            "responses": [{
                "labelAnnotations": [{
                    "score": 0.8966763,
                    "description": "food",
                    "mid": "/m/02wbm"
                }, {
                    "score": 0.80512983,
                    "description": "produce",
                    "mid": "/m/036qh8"
                }, {
                    "score": 0.73635191,
                    "description": "juice",
                    "mid": "/m/01z1kdw"
                }, {
                    "score": 0.69849229,
                    "description": "meal",
                    "mid": "/m/0krfg"
                }, {
                    "score": 0.53875387,
                    "description": "fruit",
                    "mid": "/m/02xwb"
                }]
            }]
        }

- ＆GT;我的问题是：

有人知道Google是否已发布完整的标签列表（['produce', 'meal', ...]）以及我在哪里可以找到它？
这些标签是否以任何方式构成？ - 例如众所周知，“食物”是“生产”的超集，例如。

我猜'不'和'不'因为我找不到任何东西，但是，也许不是。谢谢！

Answer 1

有一个搜索它们的API，名为 Google Knowledge Graph API ：

https://developers.google.com/knowledge-graph/reference/rest/v1/

他们将其链接到 Google Vision API文档：

的底部

https://cloud.google.com/vision/docs/labels

修改：更多信息

好吧，以/ g /开头的中间是google实体，以/ m /开头的中间是Freebase标识符，但google kgraph API并不总是返回它们。

这些数据是公开的，可以下载，但数据库中有太多记录，谷歌没有公布他们使用的那些记录。

视觉api中返回的MID示例和维基数据中的记录：

{
    desc: "institution",
    mid: "/m/01r28c",
    score: 72.29216694831848,
    confidence: 0,
    locations: [ ],
    properties: [ ]
},

https://www.wikidata.org/wiki/Q178706

最后一个freebase转储可以在这里下载：

https://developers.google.com/freebase/

Answer 2

虽然我无法验证数据库的完整性，但是Google Open Images项目有大约2万个分类的列表。

如果您浏览到download页，则可以下载带有这些描述的列表为CSV。

我检查了CloudVision中的一些参考图像，并得出以下结果：

ID / CloudVision Classification / OpenImages Classification
1. 01ssh5 / Shoulder / Shoulder (Body Part)
2. 09cx8 / Finger / Finger
3. 068jd / Photograph / Photograph
4. 01k74n / Facial expression / Facial expression
5. 04hgtk / Head / Human Head

我能够在CSV中找到具有相同含义的所有ID-因此，作为基本列表，这就足够了。请注意，您应该始终按ID而不是按类别进行匹配，因为有一些细微的变化。

如果您在CloudVision中找到了任何ID，但没有在列表中找到，我很想在评论中知道！

是否有完整的潜在标签列表，Google的Vision API将返回？

2 个答案: