MNIST数据集中用于对图像进行分类的关键特性是什么

时间:2017-11-14 05:18:39

标签: python machine-learning neural-network computer-vision mnist

我最近在学习神经网络并遇到了MNIST数据集。我知道使用sigmoid成本函数来减少损失。此外,调整重量和偏差,并在训练后找到最佳的重量和偏差。我不明白的是,在什么基础上对图像进行分类。例如,为了分类患者是否患有癌症,诸如年龄,位置等的数据成为特征。在MNIST数据集中,我没有发现任何这些。我在这里错过了一些东西。请帮帮我这个

1 个答案:

答案 0 :(得分:2)

首先,网络管道由3个主要部分组成:

  • 输入操作:
  • 影响最小值发现的参数:
  • 您的解释中的descission函数等参数 层(通常是完全连接的层)

与您必须手动提取功能的常规机器学习管道相比,CNN使用过滤器。 (像边缘检测或中提琴和琼斯中的过滤器)。

如果过滤器在图像上运行并与像素进行卷积,则会生成输出。

然后由神经元解释此输出。如果输出高于阈值,则认为它是有效的(步骤函数计数1如果有效,或者在Sigmoid的情况下它具有sigmoid函数的值)。

接下来的步骤和以前一样。

这一直到解释层(通常是softmax)。这一层解释了你的计算(如果过滤器很好地适应了你的问题,你将得到一个好的预测标签),这意味着你之间的差异很小(y_guess - y_true_label)。

现在你可以看到,对于y的猜测,我们将输入x与许多权重w相乘,并且还使用了函数。这可以看作分析中的链式规则。

为了获得更好的效果,必须知道单个重量对输入的影响。因此,您使用Backpropagation,它是关于所有w的Error的衍生物。特技是你可以重复使用或多或少反向传播的衍生物,因为你可以使用矩阵矢量符号,它变得更容易。

如果你有渐变,你可以使用最小化的正常概念,你可以沿着最陡的下降行走。 (还有许多其他渐变方法,如adagrad或adam等)。

步骤将重复直到收敛或直到达到最大纪元。

所以答案是:计算出的权重(过滤器)是检测数字和数字的关键:)