需要标准化数据

时间:2018-07-30 11:34:07

标签: machine-learning

我尝试了此博客文章中的代码:

https://www.analyticsvidhya.com/blog/2017/06/hands-on-with-deep-learning-solution-for-age-detection-practice-problem/

文章说:“ 标准化图像将使我们的火车更快。”

train_x = train_x / 255.
test_x = test_x / 255.

我不明白这里是否需要规范化。选择数字255的依据是什么,还是随机数?

1 个答案:

答案 0 :(得分:1)

  

我不明白这里是否需要规范化

只要您使用神经网络,大多数时候就可以对数据应用“ normalization”或“标准化”技术,以使其适合模型。

注意:这是NN中activation function个神经元施加的“需要”。

  

对图像进行归一化将使我们的火车更快。

这是错误!归一化与训练速度无关,归一化数据允许模型学习重要性和特征之间的相关性。大多数情况下,“非标准化”数据不允许正确近似输入,从而导致奇怪的结果。

  

选择数字255的依据是什么,还是随机数?

在这种情况下,已选择255,原因是在RGB图像中,三个颜色级别表示在0到255之间的范围内,其中0是“ Absence of color”和255(“ Presence颜色”);注意:灰度:0为“黑色”,255为“白色”。


数学参考:

标准化

enter image description here

其中 a b 表示范围,在这种情况下:0-255;

标准化

enter image description here