调节参数(lemda)如何帮助惩罚参数theta0,theta1 ..... theta n?

时间:2014-11-10 19:36:57

标签: algorithm machine-learning

我正在经历正则化的概念和使用正则化参数(lemda)来惩罚成本函数中的θ0,theta1 ... theta n 这个概念说我们将summation[from j=1 to n] of theta(j)^2添加到成本函数中。

组件summation[from j=1 to n] of theta(j)^2将惩罚或减少theta1,theta2等约等于0

但我的问题是,如果lemda = 10 and theta1 = 2, theta2 = 102^2+10^2 = 104 104*10(lemda) = 1040 那么如何将1040的这个值加到成本函数中来惩罚成本函数呢。

现在考虑theta1 = 0.01 and theta2 = 0.02 and lemda = 100 0.01^2+0.02^2 = 0.0003大约等于0 现在乘以lemda - > 0.0003 * 100 = 0.03将减少惩罚

因此,我仍然怀疑我是否采用更大的theta值或更小的theta值 - 成本函数如何受到惩罚?

1 个答案:

答案 0 :(得分:0)

成本函数本身不会受到惩罚。它惩罚所有theta(i)的{​​{1}}的大值。为什么?目标是最小化成本函数,并且意味着使其尽可能接近0(因为它是非负的)。通过将i的总和添加到所有theta(i)^2的费用中,我们会在i很大的情况下增加费用函数。因此,对于较大的theta(i),成本会自动变大。这就是为什么最小化成本函数意味着theta(i)对于所有theta(i)来说都不会太大。