应用错误收集

akaike信息标准（AIC）是否依赖于单位？

时间：2018-03-05 20:21:59

标签： statistics modeling

AIC的一个公式是：

AIC = 2k + n * Log（RSS / n）

直观地说，如果你向模型添加一个参数，你的AIC会减少（因此你应该保留参数），如果由于新参数导致的2k项的增加被n * Log的减少所抵消（RSS / n）术语由于剩余的平方和减少。但这个RSS值不是特定于单位吗？因此，如果我是模拟钱，而我的单位是数百万美元，那么添加参数的RSS变化可能非常小，并且不会抵消2k项的增加。相反，如果我的单位是便士，RSS的变化将非常大，并且可以大大抵消2k期限的增加。这种任意的单位变化会导致我决定是否保留额外参数的变化。

那么：RSS必须是AIC的标准化单位才能成为一个有用的标准吗？我不明白它怎么可能。

2 个答案:

答案 0 :(得分：3)

不，我不这么认为（部分地从我之前评论中所说的内容中划掉）。对于最简单的情况（y = a x + b 的最小二乘回归），来自wikipedia，RSS = S _yy - a x S _xy。

根据该文章中给出的定义， a 和S _xy都会增长 100 和S _{yy <如果将 y 的单位从美元更改为美分，则/ sub>增长 100 ² 。因此，在重新缩放之后，该模型的新RSS将是 100 ² 的旧RSS。我非常确定具有 k＆lt;＆gt;的模型的结果相同。 2 参数。}

因此，关键部分是 log（RSS _B / RSS _A）的AIC差异没有任何变化。在重新缩放之后，两个RSS将以相同的因子增长，并且您将获得与之前模型A和B完全相同的AIC差异。

修改

我刚发现这个one：

“单位选择引入乘法是正确的不断变成可能性。那么 log 可能性就有了添加常数，它对AIC有贡献（加倍后）。 AIC的差异没有改变。“

请注意，此评论甚至会讨论使用确切对数似然的一般情况。

答案 1 :(得分：0)

我有同样的问题，我觉得上面的现有答案可能更清楚，更直接。希望以下内容对其他人也有所阐明。

使用AIC比较模型时，需要注意的是差异。这里讨论的部分是n * log（RSS / n）。当我们针对两个不同的模型进行比较时，我们将得到： n1 * log（RSS1 / n1）+ 2k1-n2 * log（RSS2 / n2）-2k2

根据对数恒等式，我们知道log（a）-log（b）= log（a / b）。 AIC1-AIC2因此简化为：

2k1-2k2 + log（RSS1 * n2 /（RSS2 * n1））

如果我们添加增益因子G来表示单位变化，则该差异变为：

2k1-2k2 + log（G * RSS1 * n2 /（G * RSS2 * n1））= 2k1-2k2 + log（RSS1 * n2 /（RSS2 * n1））

如您所见，无论选择哪种单位，我们都将保持相同的AIC差异。