标准化响应变量的哪个链接功能和错误结构由比例&组成。计算混合效果模型中的数据

时间:2014-04-28 15:28:24

标签: r glm mixed-models

这是我的第一个问题,如果我的问题没有按照正确的指导方针被问到,那么我会道歉,但我会尽可能详细。

我想研究使用果蝇的不同自交系之间的适应性的间性变异。我已经测定了来自每个品系的两个性别的10个人的健康(n = 33个等值线)。女性健康是繁殖力,即单个女性产生的后代的数量和男性健康,作为与竞争对手男性(竞争能力)竞争的焦点男性所代表的后代的比例。由于两种测量都在不同的尺度上(即计数和比例),因此我在分析之前转换了数据。

我的数据样本看起来像这样(由于死亡,我有几个NAs)

line    sex fitness
3a  male    -0.086616292
3a  male    1.077458823
3a  male    -1.011906768
3a  male    1.077458823
3a  male    -0.126015757
3a  male    1.077458823
3a  male    -1.429779886
3a  male    NA
3a  male    NA
3a  male    -0.150576463
4a  male    0.498865275
4a  male    -0.651671321
4a  male    0.472263273
4a  male    -0.426884402
4a  male    0.165735656
4a  male    -1.429779886
4a  male    -1.429779886
4a  male    -1.429779886

我对线条和性*线互动的主要影响感兴趣。我把性治疗作为固定效应和线和线*性交互作为随机效应

这是第一次拟合这样的模型,所以我怀疑我有一些错误,见下文。

我的问题如下

(1)除了默认的高斯和身份之外,我还需要指定一个特定的链接函数和错误结构吗?由于我的响应变量是计数和比例数据的混合,它已被Z变换为相同的比例和单个列(即适应度),它既不是泊松也不是二项式。此外,在转换(即标准化)我的健身测量后,我的响应变量不正常所以是否有一些错误结构来解释这个?

(2)关于我的模型测试程序,我无法在帮助论坛或书籍中找到直接的答案,以便测试我感兴趣的固定和随机效果(性别*行)之间的相互作用。我并非完全如果有人可以提供一些有关此问题的建议我对此非常感激。

我已经包含了当我使用anova来比较具有和不具有我正在测试的效果的模型时的输出,以及每个模型的代码下方的重要性。

model1<-lmer(fitness~sex+(1|line)+(1|sex:line),data=BL1InxNoOutLiars,REML=FALSE) #FULL MODEL
    summary(model1)

Linear mixed model fit by REML ['lmerMod']
Formula: fitness ~ sex + (1 | line) + (1 | sex:line) 
   Data: BL1InxNoOutLiars 

REML criterion at convergence: 1682.278 

Random effects:
 Groups   Name        Variance Std.Dev.
 sex:line (Intercept) 0.03565  0.1888  
 line     (Intercept) 0.08432  0.2904  
 Residual             0.78479  0.8859  
Number of obs: 626, groups: sex:line, 66; line, 33

Fixed effects:
            Estimate Std. Error t value
(Intercept) -0.05413    0.07800  -0.694
sexmale      0.05028    0.08491   0.592

Correlation of Fixed Effects:
        (Intr)
sexmale -0.533


    model<-lmer(fitness~(1|line)+(1|sex:line),data=BL1InxNoOutLiars,REML=FALSE)
    anova(model1,model2) #test significance of sex, p=0.5365

OUTPUT
model2: fitness ~ (1 | line) + (1 | sex:line)
model1: fitness ~ sex + (1 | line) + (1 | sex:line)
          Df    AIC    BIC  logLik deviance  Chisq Chi Df Pr(>Chisq)
model2   4 1683.9 1701.7 -837.96   1675.9                         
model1  5 1685.5 1707.8 -837.78   1675.5 0.3644      1     0.5461

    model3<-lmer(fitness~(1|sex:line),data=BL1InxNoOutLiars,REML=FALSE)
    model4<-update(model1.1,~.-sex,REML=TRUE)#remove sex from full model as it is non-significant
    anova(model4,model3)#test significant of line, p=0.012

OUTPUT
Models:
model3: fitness ~ (1 | sex:line)
model4: fitness ~ (1 | line) + (1 | sex:line)
         Df    AIC    BIC  logLik deviance Chisq Chi Df Pr(>Chisq)  
model3  3 1688.0 1701.3 -841.00   1682.0                          
model4  4 1683.9 1701.7 -837.96   1675.9 6.074      1    0.01372 *


    model5<-lmer(fitness~(1|line),data=BL1InxNoOutLiars,REML=FALSE)
    anova(model4,model5)###LINE X SEX INTERACTION IS NS P=0.1558

OUTPUT
model5: fitness ~ (1 | line)
model4: fitness ~ (1 | line) + (1 | sex:line)
          Df    AIC    BIC  logLik deviance  Chisq Chi Df Pr(>Chisq)
model5  3 1683.9 1697.2 -838.97   1677.9                         
model4   4 1683.9 1701.7 -837.96   1675.9 2.0143      1     0.1558

如果我不清楚或以不正确的方式询问我的问题,我会表示抱歉。

提前致谢

0 个答案:

没有答案