应用错误收集

时间：2016-02-08 10:16:13

标签： machine-learning neural-network

我将使用分类南瓜的例子。以灰姑娘南瓜为例

与葫芦南瓜相比

直观地说，将这些图像分类为两个不同的输出cinderella-pumpkin和gourd-pumpkin似乎是明智的，因为它们看起来有多么不同。

我的问题是，如果我拍摄一套包含灰姑娘南瓜和葫芦南瓜的图像，并将它们分类为pumpkin类别，那么网络的性能是否会比我改为更差将它们分为两类？当两个对象如此不同以至于应该将它们分成不同的类别时，阈值是多少？

或者为了清晰起见采取一个更极端的例子，如果我拍摄猫和菠萝图片并将它们归类于同一类别，那么在比较每个相应对象时，网络的能力会受到怎样的影响？如果有人创建cat输出和pineapple输出？

答案 0 :(得分：1)

这取决于训练观察的固有相似性。我没有设置阈值：我使用功率迭代聚类（或其他无监督分类）来指导我在训练数据中存在显着划分的位置。 k-means也是一种流行的选择，因为它是一种常见的实现，并且相对容易理解。

另一个考虑因素是＆＃34;非南瓜＆＃34;数据，如篮球（与你的灰姑娘相比）。我再次采用无监督学习方法。在这种情况下，我预计篮球会比灰姑娘更接近灰姑娘。这表明南瓜类型的单独类别 - 或者在图像处理中可能更多的特征检测，以找到南瓜品种的相似性。

这有帮助吗？