我在R
中有一个数据框,其中包含一个从属计数变量Freq
和解释变量Y1
,Y2
,...,Ym
。
我需要估计所有可能的对数线性模型,包括(Y1
,...,Ym
)从模型开始,没有交互到具有所有可能的交互的模型。
也就是说,使用m=3
个变量,来自最简单的Freq ~ Y1+Y2+Y3
饱和Freq ~ ( Y1+Y2+Y3 )^3
此外,我只需要分层模型,也就是说,如果不包含双向互动Y2:Y3
,则不应包含Y1:Y2:Y3
或Y2:Y3:Y4
的高阶互动在那个模型中。
因此,在上面的例子中,仍有7个模型:
Y1*Y2+Y3
,Y1*Y3+Y2
,Y1+Y2*Y3
,
Y1*Y2+Y1*Y3
,Y1*Y2+Y2*Y3
,Y1*Y3+Y2*Y3
,
(Y1+Y2+Y3)^2
Y1
,...,Ym
是0/1变量,因此如果将它们编码为因子或数字则无关紧要。
我正在考虑一些递归函数操纵字符串来生成所有公式,并且对于每个公式,通过loglin
或glm
泊松估计模型。但是,只要我可以检索每个拟合模型的输出(系数估计值),就可以使用特定的包来估计所有可能的(分层)对数线性模型。
我知道模型的数量可能很大,但我需要详尽的搜索,而不是有效的模型选择。