我正在分析有关鳟鱼生长的观察性研究的数据。因此数据框中有很多NA。此外,不同的治疗方法具有不同的观察数量。所以我认为这可以称为不平衡设计?
Year Site FishID Size Cover AGE L1
2010 LT1 10_LT1 _ 11 Large Heavy 2 5.88
2010 LT3 10_LT3 _ 14 Large Heavy 2 5.228571429
2010 SO4 10_SO4 _ 8 Small Open 0 NA
2010 SO5 10_SO5 _ 22 Small Open 0 NA
2011 LT1 11_LT1 _ 14 Large Heavy 1 6.44
2011 LT1 11_LT1 _ 15 Large Heavy 1 6.25
2011 LT1 11_LT1 _ 16 Large Heavy 1 6.421052632
2011 LT1 11_LT1 _ 18 Large Heavy 1 7.74
2011 SO5 11_SO5 _ 6 Small Open 1 7.7625
2011 SO5 11_SO5 _ 8 Small Open 1 6.914285714
2011 SO5 11_SO5 _ 13 Small Open 1 6.5
2011 SO5 11_SO5 _ 16 Small Open 1 7.2
2011 ST1 11_ST1 _ 21 Small Heavy 0 NA
2011 ST2 11_ST2 _ 10 Small Heavy 0 NA
2011 ST2 11_ST2 _ 5 Small Heavy 0 NA
2011 ST3 11_ST3 _ 20 Small Heavy 0 NA
2011 ST4 11_ST4 _ 5 Small Heavy 0 NA
2011 ST1 11_ST1 _ 9 Small Heavy 1 7.521428571
2011 ST1 11_ST1 _ 17 Small Heavy 1 8.169230769
2011 ST1 11_ST1 _ 20 Small Heavy 1 7.03125
我的固定效果是流大小:2级流覆盖:2级, 年份:2个级别和年龄:3个级别。
我还选择了一堆网站来检查流大小和流覆盖效果。所以我认为网站被归类为随机效应?
L1
是增长率的代理。
在这个阶段,我的最大模型看起来像这样:
m1=lme(L1~Year*Age*Size*Cover, random=~1|Site ,data=Trout_Growth,method="ML",na.action=na.exclude)
qqnorm(residuals(m1))
qqline(residuals(m1)) # Normality OK
plot(density(residuals(m1),na.rm=T)) ***## heteroscedasticity present (lme should handle this??) ##***
summary(m1)
anova(m1,test=T,type="marginal") ***## marginal used because of unbalanced design?? ##***
我当然好好看看这个网站很好但我仍然不确定包含随机因素Site的正确表示法。 (lme和lmer似乎使用不同的符号。这是正确的吗?)
我假设我在问这是否是改进模型的正确起点。我开始非常喜欢R但是没有关于R代码的常规竖起大拇指,诱惑就是回到基于windows的统计软件。
非常感谢任何意见或建议。
Diarm