德雷克计划拟合lmer模型失败

时间:2020-07-28 23:03:46

标签: r lme4 drake-r-package

我正在尝试在lme4::lmer计划中使用某些drake模型,但出现错误

找不到“数据”,公式环境中缺少一些变量

如果我替换为lm模型,它将起作用。

这是一个可重复的例子

library(drake)
library(lme4)
#> Loading required package: Matrix
#> 
#> Attaching package: 'Matrix'
#> The following object is masked from 'package:drake':
#> 
#>     expand

plan_lm <- drake_plan(
  dat = iris,
  mod = lm(Sepal.Length ~ Petal.Length, data = dat)
)

make(plan_lm)
#> ℹ Consider drake::r_make() to improve robustness.
#> ▶ target dat
#> ▶ target mod

plan_lmer <- drake_plan(
  dat1 = iris,
  mod1 = lmer(Sepal.Length ~ Petal.Length, data = dat1)
)

make(plan_lmer)
#> ▶ target dat1
#> ▶ target mod1
#> x fail mod1
#> Error: target mod1 failed.
#> diagnose(mod1)$error$message:
#>   'data' not found, and some variables missing from formula environment
#> diagnose(mod1)$error$calls:
#>   lme4::lFormula(formula = Sepal.Length ~ Petal.Length, data = dat1, 
#>     control = list("nloptwrap", TRUE, 1e-05, TRUE, FALSE, list(
#>         "ignore", "stop", "ignore", "stop", "stop", "message+drop.cols", 
#>         "warning", "stop"), list(list("warning", 0.002, NULL), 
#>         list("message", 1e-04), list("warning", 1e-06)), list()))
#>   lme4:::checkFormulaData(formula, data, checkLHS = control$check.formula.LHS == 
#>     "stop")
#>   base::stop("'data' not found, and some variables missing from formula environment", 
#>     call. = FALSE)
Created on 2020-07-29 by the reprex package (v0.3.0)

有什么建议吗?

2 个答案:

答案 0 :(得分:4)

这种边缘情况是https://github.com/ropensci/drake/issues/1012https://github.com/ropensci/drake/issues/1163的实例。 drake创建了自己的环境来运行命令,因此具有dat的环境与模型实际运行的环境不同。有充分的理由drake会这样做,并且行为不会改变,因此,除非lme4发生变化,否则此问题将是永久性的。我可以提供的最佳解决方法是在运行时在目标环境中创建公式,类似于下面的reprex。您必须手动强制数据和公式在同一环境中。我建议编写一个自定义函数来做到这一点。

library(drake)
suppressPackageStartupMessages(library(lme4))

fit_lmer <- function(dat) {
  envir <- environment()
  envir$dat <- dat
  f <- as.formula("Reaction ~ Days + (Days | Subject)", env = envir)
  lme4::lmer(f, data = dat)
}

plan <- drake_plan(
  dat = sleepstudy,
  mod = fit_lmer(dat)
)

make(plan)
#> ▶ target dat
#> ▶ target mod

reprex package(v0.3.0)于2020-07-29创建

顺便说一句,如果可以,请考虑避开虹膜数据集:https://armchairecology.blog/iris-dataset/

答案 1 :(得分:2)

我可以通过在新目标中重新分配来解决此问题

plan <- drake_plan(
  dat = sleepstudy,
  mod =  {dat <- dat
    lmer(Reaction ~ Days + (Days | Subject), dat)
  }
)
make(plan)

或跟随https://github.com/ropensci/drake/issues/1163,使用readd(dat)