我的问题是使用AIC来比较一个数据集中的特定变量适合与另一个数据集的匹配程度。也就是说,假设我有一个预测变量x
和两个不同的数据集A
和B
。我希望能够说{34} x
适合/不适合A
中的数据而不是B
"。我知道AIC可用于确定比较适合相同数据的模型,并确定特定因素是否是重要因素。如果AIC(M1)-AIC(M2)> 2(或其他一些阈值),我们可以说M1比更好而且M1中的任何额外因子都是显着的。
问题是,我们可以比较模型和数据集之间AIC中的差异吗?回到示例,我已经获得了模型MA1,该模型在数据A
上使用因子x
和模型MA2进行了训练,模型MA2在没有A
的{{1}}上进行了训练。我也有适合x
的MB1和MB2。我可以比较AIC(MA1)和AIC(MA2)之间的差异以及AIC(MB1)和AIC(MB2)之间的差异吗?如果AIC(MA1)-AIC(MA2)> AIC(MB1) - AIC(MB2),这是否意味着B
解释x
数据中的方差多于A
中的方差?
我知道可能有更好的方法来衡量B
的效果,但我只是要求我自己对AIC如何运作以及它在更宏大的方案中的含义的谴责。