AIC的一个公式是:
AIC = 2k + n * Log(RSS / n)
直观地说,如果你向模型添加一个参数,你的AIC会减少(因此你应该保留参数),如果由于新参数导致的2k项的增加被n * Log的减少所抵消(RSS / n)术语由于剩余的平方和减少。但这个RSS值不是特定于单位吗?因此,如果我是模拟钱,而我的单位是数百万美元,那么添加参数的RSS变化可能非常小,并且不会抵消2k项的增加。相反,如果我的单位是便士,RSS的变化将非常大,并且可以大大抵消2k期限的增加。这种任意的单位变化会导致我决定是否保留额外参数的变化。
那么:RSS必须是AIC的标准化单位才能成为一个有用的标准吗?我不明白它怎么可能。
答案 0 :(得分:3)
不,我不这么认为(部分地从我之前评论中所说的内容中划掉)。对于最简单的情况(y = a x + b 的最小二乘回归),来自wikipedia,RSS = S yy - a x S xy 。
根据该文章中给出的定义, a 和S xy 都会增长 100 和S yy <如果将 y 的单位从美元更改为美分,则/ sub>增长 100 2 。因此,在重新缩放之后,该模型的新RSS将是 100 2 的旧RSS。我非常确定具有 k&lt;&gt;的模型的结果相同。 2 参数。
因此,关键部分是 log(RSS B / RSS A )的AIC差异没有任何变化。在重新缩放之后,两个RSS将以相同的因子增长,并且您将获得与之前模型A和B完全相同的AIC差异。
修改强>
我刚发现这个one:
“单位选择引入乘法是正确的 不断变成可能性。那么 log 可能性就有了 添加常数,它对AIC有贡献(加倍后)。 AIC的差异没有改变。“
请注意,此评论甚至会讨论使用确切对数似然的一般情况。
答案 1 :(得分:0)
我有同样的问题,我觉得上面的现有答案可能更清楚,更直接。希望以下内容对其他人也有所阐明。
使用AIC比较模型时,需要注意的是差异。这里讨论的部分是n * log(RSS / n)。当我们针对两个不同的模型进行比较时,我们将得到: n1 * log(RSS1 / n1)+ 2k1-n2 * log(RSS2 / n2)-2k2
根据对数恒等式,我们知道log(a)-log(b)= log(a / b)。 AIC1-AIC2因此简化为:
2k1-2k2 + log(RSS1 * n2 /(RSS2 * n1))
如果我们添加增益因子G来表示单位变化,则该差异变为:
2k1-2k2 + log(G * RSS1 * n2 /(G * RSS2 * n1))= 2k1-2k2 + log(RSS1 * n2 /(RSS2 * n1))
如您所见,无论选择哪种单位,我们都将保持相同的AIC差异。