如果在进行线性回归之前对数据应用缩放会怎样?
答案 0 :(得分:0)
需要缩放:更快地进行渐变下降覆盖(意味着使迭代次数或循环次数更少以达到局部最小值)。要使梯度下降速度快,您需要在相同的范围内制作多个特征值。喜欢-1< x< 1.不是一个值是5,其他值是0.1 ..等等
为什么我们需要这样做:让我们想象你有两个功能x1和x2。大的x1值大小与x2相比更大,在这种情况下,您的成本函数将呈现非常倾斜的椭圆形状。这意味着培训时间会更长,达到当地最低标准。
为了更加清晰,请点击此链接:https://www.coursera.org/learn/machine-learning/lecture/xx3Da/gradient-descent-in-practice-i-feature-scaling