每个输出单元有多大不同?

时间:2016-02-08 10:16:13

标签: machine-learning neural-network

我将使用分类南瓜的例子。以灰姑娘南瓜为例

enter image description here

与葫芦南瓜相比

enter image description here

直观地说,将这些图像分类为两个不同的输出cinderella-pumpkingourd-pumpkin似乎是明智的,因为它们看起来有多么不同。

我的问题是,如果我拍摄一套包含灰姑娘南瓜和葫芦南瓜的图像,并将它们分类为pumpkin类别,那么网络的性能是否会比我改为更差将它们分为两类?当两个对象如此不同以至于应该将它们分成不同的类别时,阈值是多少?

或者为了清晰起见采取一个更极端的例子,如果我拍摄猫和菠萝图片并将它们归类于同一类别,那么在比较每个相应对象时,网络的能力会受到怎样的影响?如果有人创建cat输出和pineapple输出?

1 个答案:

答案 0 :(得分:1)

这取决于训练观察的固有相似性。我没有设置阈值:我使用功率迭代聚类(或其他无监督分类)来指导我在训练数据中存在显着划分的位置。 k-means也是一种流行的选择,因为它是一种常见的实现,并且相对容易理解。

另一个考虑因素是"非南瓜"数据,如篮球(与你的灰姑娘相比)。我再次采用无监督学习方法。在这种情况下,我预计篮球会比灰姑娘更接近灰姑娘。这表明南瓜类型的单独类别 - 或者在图像处理中可能更多的特征检测,以找到南瓜品种的相似性。

这有帮助吗?