机器学习图像:如何预处理数据

时间:2016-03-23 11:01:23

标签: image-processing machine-learning classification

几年前,我对非常简单的监督机器学习和分类进行了研究,现在我想回到一个真实的用例。

我想将它应用于纹理分类。例如,给出带有不同壁纸的墙壁的标记图片,我希望它能够学习分类它是什么样的壁纸。

我知道,一般来说,图像被分成小块,形成一个“视觉词汇”,然后我们可以训练算法。

但是我坚持第一步:在应用学习算法之前,我是如何准备图像的?例如,我知道大多数时候学习是在二进制图像上完成的,但在我看来,颜色可能是一个类的特征。但是,对于通过其图案识别的壁纸,或者可能是其粒状纹理,二值化可能是有用的......在这种情况下,我不知道是否存在应用于图像的通用操作以使这些特征更加明显。如果是这种情况,我应该为每个样本创建几个图像吗?

总而言之,我想知道在创建特征向量之前用于准备图像的常用方法是什么,特别是因为我正在处理可能使过程更复杂的RGB数据。任何建议将不胜感激

1 个答案:

答案 0 :(得分:0)

对于每个班级,您剪切小补丁,您可以保留颜色信息。大多数DNN库都支持多通道图像。然后,您可以简单地将每个像素值除以255(如果您的图像是8位)并减去0.5,就像每个补丁居中(平均为0),并且标准偏差低于0.5。

但要小心,你的输出层每个类需要一个神经元,这会让你的DNN非常大。