我使用逻辑回归。我有一些功能。它们的值在0和1之间,(函数可以产生的最大值是1,最小值是0),但是在训练和测试数据中,最大值都非常低(例如0.11),因此所有值都很低,彼此接近。我的问题是,将特征值标准化/转移到正常标度(0到1之间)的最佳标准方法是什么,这样逻辑回归不会受到不适当值的影响。
任何帮助都将受到高度赞赏。
答案 0 :(得分:0)
有不同的特征缩放/规范化方法。
如果您只想让要素值在[0..1]
范围内,请为每个要素执行以下操作:
有些教程建议将功能扩展到范围[-0.5 .. 0.5]
:
我更倾向于按标准偏差缩放功能,如Stanford lectures中所述(参见Preprocessing your data
章节):