我正在经历正则化的概念和使用正则化参数(lemda)来惩罚成本函数中的θ0,theta1 ... theta n
这个概念说我们将summation[from j=1 to n] of theta(j)^2
添加到成本函数中。
组件summation[from j=1 to n] of theta(j)^2
将惩罚或减少theta1,theta2等约等于0
但我的问题是,如果lemda = 10 and theta1 = 2, theta2 = 10
等
2^2+10^2 = 104
104*10(lemda) = 1040
那么如何将1040的这个值加到成本函数中来惩罚成本函数呢。
现在考虑theta1 = 0.01 and theta2 = 0.02 and lemda = 100
0.01^2+0.02^2 = 0.0003
大约等于0
现在乘以lemda - > 0.0003 * 100 = 0.03
将减少惩罚
因此,我仍然怀疑我是否采用更大的theta值或更小的theta值 - 成本函数如何受到惩罚?
答案 0 :(得分:0)
成本函数本身不会受到惩罚。它惩罚所有theta(i)
的{{1}}的大值。为什么?目标是最小化成本函数,并且意味着使其尽可能接近0(因为它是非负的)。通过将i
的总和添加到所有theta(i)^2
的费用中,我们会在i
很大的情况下增加费用函数。因此,对于较大的theta(i)
,成本会自动变大。这就是为什么最小化成本函数意味着theta(i)
对于所有theta(i)
来说都不会太大。