使用plyr在大型数据集

时间:2015-08-07 06:23:20

标签: r plyr

我正在尝试在一个大型数据集上运行一系列GLMM来探索不同研究地点的几种植物物种的植物性状和环境因子之间的关系,使用图表和年份作为模型中的随机因素。我正在使用plyr并且我一直收到以下错误消息:

  

eval.quoted(.variables,data)中的错误:     envir必须是NULL,列表或环境。

我的数据集采用以下格式:

   Site    Plot   Species  FlowerDate  Year     Factor   FactorValue
1    AD   ADC01     CTETB         179  1999   numJulSF           160

这是我正在使用的代码:

data.list <- dlply(data,c("Species","Site","FlowerDate","Year", "Factor"), 
                   function(df){lmer(FlowerDate~FactorValue+(1|Plot)+(1|Year), 
                                data=df)})

我已经看到其他人有这个问题,但我仍然难以解决它。

1 个答案:

答案 0 :(得分:1)

在我看来,主要的问题是你是根据模型中实际包含的一些变量来分割数据(&#39; FlowerData&#39;和#39;年&#39;) ,原则上没有意义(包括不变量的输入变量或建模不变的输出变量没有意义)。

除此之外,dlply + lmer的组合应该起作用;事实上,我经常使用它没有问题...