如何规范化近距离数据?

时间:2016-02-03 12:40:56

标签: classification normalization logistic-regression data-transfer normal-distribution

我使用逻辑回归。我有一些功能。它们的值在0和1之间,(函数可以产生的最大值是1,最小值是0),但是在训练和测试数据中,最大值都非常低(例如0.11),因此所有值都很低,彼此接近。我的问题是,将特征值标准化/转移到正常标度(0到1之间)的最佳标准方法是什么,这样逻辑回归不会受到不适当值的影响。

任何帮助都将受到高度赞赏。

1 个答案:

答案 0 :(得分:0)

有不同的特征缩放/规范化方法。

如果您只想让要素值在[0..1]范围内,请为每个要素执行以下操作:

enter image description here

有些教程建议将功能扩展到范围[-0.5 .. 0.5]

enter image description here

我更倾向于按标准偏差缩放功能,如Stanford lectures中所述(参见Preprocessing your data章节):

enter image description here