从混合模型(lme4)公式中提取组件

时间:2012-12-27 04:41:55

标签: r formula

我正在尝试在R中编写一个接受如下公式的函数:

y ~ 1 + sex + age + (1 | school) + (1 | school:section)

是否有一种简单的方法可以提取此公式的各种成分以供我的功能使用?例如,我希望能够获得左侧,每个变量,随机效应变量以及它们如何嵌套等。

有没有比走公式解析树更简单的方法呢?

4 个答案:

答案 0 :(得分:10)

如果您想要一个不需要正则表达式的解决方案,我建议您考虑terms

form <- y ~ 1 + sex + age + (1 | school) + (1 | school:section)
terms(form)

## y ~ 1 + sex + age + (1 | school) + (1 | school:section)
## attr(,"variables")
## list(y, sex, age, 1 | school, 1 | school:section)
## attr(,"factors")
##                    sex age 1 | school 1 | school:section
## y                    0   0          0                  0
## sex                  1   0          0                  0
## age                  0   1          0                  0
## 1 | school           0   0          1                  0
## 1 | school:section   0   0          0                  1
## attr(,"term.labels")
## [1] "sex"                "age"                "1 | school"         "1 | school:section"
## attr(,"order")
## [1] 1 1 1 1
## attr(,"intercept")
## [1] 1
## attr(,"response")
## [1] 1
## attr(,".Environment")
## <environment: R_GlobalEnv>

此外,您可以使用attributes

从中提取属性
attributes(terms(form))$term.labels

## [1] "sex"                "age"                "1 | school"         "1 | school:section"

答案 1 :(得分:6)

扩展@Ben Bolker的建议:

f1 <- formula(y ~ 1 + sex + age + (1 | school) + (1 | school:section))

左侧(假设左侧有一个变量):

all.vars(terms(f1))[1] # character

变量:

all.vars(delete.response(terms(f1))) # character

随机效应:

lme4:::findbars(f1) # returns list of language items

还有formula.tools这个包,虽然它没有专门针对混合效果模型的方法:

library(formula.tools)
lhs(f1)
r1 <- rhs.vars(f1) # gives fixed and random effects as character
r1[grepl("\\|", r1)] # character vector of random effects

答案 2 :(得分:1)

可能是这样的:

x <- as.formula("y ~ 1 + sex + age + (1 | school) + (1 | school:section)")
x[[2]]
x[[3]][2]

你也可以使用strsplit

strsplit(as.character(x[[3]][2]), "\\+")

答案 3 :(得分:0)

> form <- y ~ 1 + sex + age + (1 | school) + (1 | school:section)
> form[1]
`~`()
> form[2]
y()
> form[3]
1 + sex + age + (1 | school) + (1 | school:section)()

所以基本上你应该将LHS和RHS作为列表元素来解决。要拆分RHS,你可以使用TylerRinker的答案。