Question

我有点了解哪些功能，比如学习SPAM的ML算法，某些关键字可能是一个功能？

但是在着名的MNIST数字数据集中，我看到一个数字矩阵，整个矩阵是一个单一的特征吗？或者是矩阵中每个数字的特征？

Answer 1

在我看来，你缺乏一些重要的文献综述。以下是一些关于RNN和CNN的优秀论文，可用于图像识别应用：

https://pdfs.semanticscholar.org/86ef/e7769f2b8a0e15ca213ab09881e6705caeb0.pdf https://arxiv.org/pdf/1506.00019.pdf

什么是功能？特征表示输入向量的一个元素，用于训练模型并产生输出。

根据应用程序确定功能集。输入向量的每个元素是不同的（依赖的或独立的）特征。

使用MNIST数字数据集查看本教程： https://github.com/aymericdamien/TensorFlow-Examples/blob/master/examples/3_NeuralNetworks/recurrent_network.py

它说： “”” 为了使用递归神经网络对图像进行分类，我们考虑每个图像行作为像素序列。因为MNIST图像形状是28 * 28px，我们将会这样做每个样本处理28个步骤的28个序列。 '''

RNN建立在序列之上，因此如果图像是28乘28，你可以在28个28个特征序列中打破它。

# Network Parameters
num_input = 28 # MNIST data input (img shape: 28*28)
timesteps = 28 # timesteps

这是您在网络参数中看到的内容。表示图像的一个序列的28 特征（num_input = 28）。

要再次重复，输入向量的每个元素都被视为一个要素。此外，分析师有责任正确定义这些功能。

Answer 2

从技术上讲，特征是一个数值，它可区别地表示（或试图有区别地表示）输入或输入的某些部分。在MNIST的情况下，其中图像尺寸是28×28，整个图像矩阵被平坦化（通常是逐行地）成为1D特征向量，该特征向量的每个元素是特征（在这种情况下，简单地是图像强度）。想要使用的特征的类型或类型完全是特定于问题的。例如，您可以使用多个白色像素作为您的功能，而不是展平整个MNIST数字图像;然而，它归结为这种特征对于给定问题的辨别力如何。

在垃圾邮件分类的情况下，通常这些功能是单词的频率（还涉及其他一些内容，例如停用词消除，词干等）。

您可以选择或设计针对给定问题的多个要素，例如您在上面的评论中提到的笔划长度，曲率，边数等。然而，主要思想是特征应该对所有类具有足够的辨别力，并且它们不应相互派生（这一点导致我们另一个称为特征或维数减少的问题）。我建议你阅读这个维基百科页面here，然后继续阅读关于特征提取和降维的学术演示，例如this（这个特定于图像）。这有助于您了解整体构思。

另外注意，这些特征被组合成一个称为特征向量的紧凑表示。在这种特殊情况下，如前所述，您有一维特征向量，其中包含图像强度作为特征。

什么被认为是机器学习中的图像功能？

2 个答案: