我将使用分类南瓜的例子。以灰姑娘南瓜为例
与葫芦南瓜相比
直观地说,将这些图像分类为两个不同的输出cinderella-pumpkin
和gourd-pumpkin
似乎是明智的,因为它们看起来有多么不同。
我的问题是,如果我拍摄一套包含灰姑娘南瓜和葫芦南瓜的图像,并将它们分类为pumpkin
类别,那么网络的性能是否会比我改为更差将它们分为两类?当两个对象如此不同以至于应该将它们分成不同的类别时,阈值是多少?
或者为了清晰起见采取一个更极端的例子,如果我拍摄猫和菠萝图片并将它们归类于同一类别,那么在比较每个相应对象时,网络的能力会受到怎样的影响?如果有人创建cat
输出和pineapple
输出?
答案 0 :(得分:1)
这取决于训练观察的固有相似性。我没有设置阈值:我使用功率迭代聚类(或其他无监督分类)来指导我在训练数据中存在显着划分的位置。 k-means也是一种流行的选择,因为它是一种常见的实现,并且相对容易理解。
另一个考虑因素是"非南瓜"数据,如篮球(与你的灰姑娘相比)。我再次采用无监督学习方法。在这种情况下,我预计篮球会比灰姑娘更接近灰姑娘。这表明南瓜类型的单独类别 - 或者在图像处理中可能更多的特征检测,以找到南瓜品种的相似性。
这有帮助吗?