我的数据框看起来像这样: my.df
y cat1 cat2 2cat
1 a NA 0
2 b a 1
3 c NA 0
4 a c 1
这里有4位参与者。每个参与者可以按类别" a"," b"," c"进行分类。它们也可以分为两类,由2cat变量和cat2表示。
如果我们想要考虑每个类别的固定效果,并忽略参与者分为两类或更多类别的可能性,这是微不足道的。
model <- y ~ factor(cat1)
m1 <- lm(model, my.df)
这实际上创建了虚拟变量&#34; a&#34;,&#34; b&#34;,&#34; c&#34;。但是,如果我对多个成员资格的影响感兴趣,我需要创建一个新的数据框:
y a b c 2cat
1 1 0 0 0
2 1 1 0 1
3 0 0 1 0
4 1 0 1 1
运行模型
model <- y ~ a + b + c
m2 <- lm(model, my.df)
这对于dcast和将因子变量按到虚拟变量矩阵中的一切都是可行的;我想知道是否有一种快速的方法可以在模型中指定允许我运行相同的回归但使用第一个数据结构(即不将因子变量扩展为虚拟矩阵)?
谢谢!