在Watson Image Recognition (IR) demo中,您可以为应用提供图片,并对其进行分类,并告诉您图片中的内容。它是如何实现这一目标的?
据我从文档中可以看出,你只能给它正面和负面的图像,它只能说'是',这是披萨,或者'不',这不是披萨。它无法指定是披萨还是意大利面。
有没有办法实现这个目标?
答案 0 :(得分:5)
该服务使用一组分类器;每个分类器仅用于单个标签,并且必须使用它自己的正负图像集进行训练。要获得披萨与意大利面,您必须创建两个分类器并使用正面和负面图像训练每个分类器。 (但是,在这种特殊情况下,披萨的负面图像可能只是意大利面的正面图像,反之亦然。)
有一个默认的分类器集合,它们具有相当广泛的标签,所有标签都以这种方式进行了培训;我相信the demo使用该默认集合+ AlchemyVision的组合(其具有更广泛的分类,但不可训练)。您可以看到the demo's source code on github。
您可以在Visual Recognition服务文档中阅读更多内容:http://www.ibm.com/smarterplanet/us/en/ibmwatson/developercloud/doc/visual-recognition/index.shtml