什么被认为是机器学习中的图像功能?

时间:2017-09-08 14:22:38

标签: machine-learning

我有点了解哪些功能,比如学习SPAM的ML算法,某些关键字可能是一个功能?

但是在着名的MNIST数字数据集中,我看到一个数字矩阵,整个矩阵是一个单一的特征吗?或者是矩阵中每个数字的特征?

2 个答案:

答案 0 :(得分:0)

在我看来,你缺乏一些重要的文献综述。 以下是一些关于RNN和CNN的优秀论文,可用于图像识别应用:

https://pdfs.semanticscholar.org/86ef/e7769f2b8a0e15ca213ab09881e6705caeb0.pdf https://arxiv.org/pdf/1506.00019.pdf

什么是功能?特征表示输入向量的一个元素,用于训练模型并产生输出。

根据应用程序确定功能集。 输入向量的每个元素是不同的(依赖的或独立的)特征。

使用MNIST数字数据集查看本教程: https://github.com/aymericdamien/TensorFlow-Examples/blob/master/examples/3_NeuralNetworks/recurrent_network.py

它说: “”” 为了使用递归神经网络对图像进行分类,我们考虑每个图像 行作为像素序列。因为MNIST图像形状是28 * 28px,我们将会这样做 每个样本处理28个步骤的28个序列。 '''

RNN建立在序列之上,因此如果图像是28乘28,你可以在28个28个特征序列中打破它。

# Network Parameters
num_input = 28 # MNIST data input (img shape: 28*28)
timesteps = 28 # timesteps

这是您在网络参数中看到的内容。表示图像的一个序列的28 特征(num_input = 28)。

要再次重复,输入向量的每个元素都被视为一个要素。此外,分析师有责任正确定义这些功能。

答案 1 :(得分:0)

从技术上讲,特征是一个数值,它可区别地表示(或试图有区别地表示)输入或输入的某些部分。在MNIST的情况下,其中图像尺寸是28×28,整个图像矩阵被平坦化(通常是逐行地)成为1D特征向量,该特征向量的每个元素是特征(在这种情况下,简单地是图像强度)。想要使用的特征的类型或类型完全是特定于问题的。例如,您可以使用多个白色像素作为您的功能,而不是展平整个MNIST数字图像;然而,它归结为这种特征对于给定问题的辨别力如何。

在垃圾邮件分类的情况下,通常这些功能是单词的频率(还涉及其他一些内容,例如停用词消除,词干等)。

您可以选择或设计针对给定问题的多个要素,例如您在上面的评论中提到的笔划长度,曲率,边数等。然而,主要思想是特征应该对所有类具有足够的辨别力,并且它们不应相互派生(这一点导致我们另一个称为特征或维数减少的问题)。我建议你阅读这个维基百科页面here,然后继续阅读关于特征提取和降维的学术演示,例如this(这个特定于图像)。这有助于您了解整体构思。

另外注意,这些特征被组合成一个称为特征向量的紧凑表示。在这种特殊情况下,如前所述,您有一维特征向量,其中包含图像强度作为特征。