我正在尝试在lme4::lmer
计划中使用某些drake
模型,但出现错误
找不到“数据”,公式环境中缺少一些变量
如果我替换为lm
模型,它将起作用。
这是一个可重复的例子
library(drake)
library(lme4)
#> Loading required package: Matrix
#>
#> Attaching package: 'Matrix'
#> The following object is masked from 'package:drake':
#>
#> expand
plan_lm <- drake_plan(
dat = iris,
mod = lm(Sepal.Length ~ Petal.Length, data = dat)
)
make(plan_lm)
#> ℹ Consider drake::r_make() to improve robustness.
#> ▶ target dat
#> ▶ target mod
plan_lmer <- drake_plan(
dat1 = iris,
mod1 = lmer(Sepal.Length ~ Petal.Length, data = dat1)
)
make(plan_lmer)
#> ▶ target dat1
#> ▶ target mod1
#> x fail mod1
#> Error: target mod1 failed.
#> diagnose(mod1)$error$message:
#> 'data' not found, and some variables missing from formula environment
#> diagnose(mod1)$error$calls:
#> lme4::lFormula(formula = Sepal.Length ~ Petal.Length, data = dat1,
#> control = list("nloptwrap", TRUE, 1e-05, TRUE, FALSE, list(
#> "ignore", "stop", "ignore", "stop", "stop", "message+drop.cols",
#> "warning", "stop"), list(list("warning", 0.002, NULL),
#> list("message", 1e-04), list("warning", 1e-06)), list()))
#> lme4:::checkFormulaData(formula, data, checkLHS = control$check.formula.LHS ==
#> "stop")
#> base::stop("'data' not found, and some variables missing from formula environment",
#> call. = FALSE)
Created on 2020-07-29 by the reprex package (v0.3.0)
有什么建议吗?
答案 0 :(得分:4)
这种边缘情况是https://github.com/ropensci/drake/issues/1012和https://github.com/ropensci/drake/issues/1163的实例。 drake
创建了自己的环境来运行命令,因此具有dat
的环境与模型实际运行的环境不同。有充分的理由drake
会这样做,并且行为不会改变,因此,除非lme4
发生变化,否则此问题将是永久性的。我可以提供的最佳解决方法是在运行时在目标环境中创建公式,类似于下面的reprex。您必须手动强制数据和公式在同一环境中。我建议编写一个自定义函数来做到这一点。
library(drake)
suppressPackageStartupMessages(library(lme4))
fit_lmer <- function(dat) {
envir <- environment()
envir$dat <- dat
f <- as.formula("Reaction ~ Days + (Days | Subject)", env = envir)
lme4::lmer(f, data = dat)
}
plan <- drake_plan(
dat = sleepstudy,
mod = fit_lmer(dat)
)
make(plan)
#> ▶ target dat
#> ▶ target mod
由reprex package(v0.3.0)于2020-07-29创建
顺便说一句,如果可以,请考虑避开虹膜数据集:https://armchairecology.blog/iris-dataset/
答案 1 :(得分:2)
我可以通过在新目标中重新分配来解决此问题
plan <- drake_plan(
dat = sleepstudy,
mod = {dat <- dat
lmer(Reaction ~ Days + (Days | Subject), dat)
}
)
make(plan)
或跟随https://github.com/ropensci/drake/issues/1163,使用readd(dat)