R:比较两个模型的似然比检验,但缺失的数据使两个模型不在同一维度

时间:2013-08-23 22:29:21

标签: r

我正在尝试在两个模型之间进行似然比测试。

glm.model1 <- glm(result ~ height + weight )
glm.model2 <- glm(result ~ hight + weight + speed + speed : height + speed : weight )
require(lmtest)    
a <- lrtest(glm.model1, glm.model2)

我收到以下错误:

Error in lrtest.default(glm.model1, glm.model2) : 
models were not all fitted to the same size of dataset

我知道我的一些“速度”数据丢失,但没有高度和重量数据丢失,因此模型2包含变量“速度”但模型1没有,模型2的数据点被glm删除由于缺失。因此,当我在模型2和模型1之间进行似然比检验时,数据维度不相等,我最终得到如上所述的错误消息。有没有办法可以查找模型2中删除的数据点,所以在我的简化模型中,我可以包含一些脚本来删除相同的数据点,以保持数据的维度相同?

这是我尝试过的:

1)添加na.action = na.pass以保留模型2中的所有缺失数据,但它不起作用。

2)尝试过:

glm.model1 <- glm(result ~ height + weight + speed - speed )
## This does work and it gets rid of the sample with "speed" missing, but this is like cheating. 

以下是每个模型的摘要:

  

摘要(glm.model1)

......

    Null deviance: 453061  on 1893  degrees of freedom
Residual deviance: 439062  on 1891  degrees of freedom
AIC: 15698

Number of Fisher Scoring iterations: 2

Fisher评分迭代次数:2

  

摘要(glm.model2)

......
    Null deviance: 451363  on 1887  degrees of freedom
Residual deviance: 437137  on 1882  degrees of freedom
  (6 observations deleted due to missingness)          ## This is what I want to look at:
AIC: 15652
 Number of Fisher Scoring iterations: 2

如何查看已删除的观察结果并写入脚本以删除其他模型中的相同观察结果?谢谢!

1 个答案:

答案 0 :(得分:5)

您可以使用subset函数的glm()参数:

glm.model1 <- glm(result ~ height + weight, subset=!is.na(speed) )