我试图在最大似然估计的背景下更好地理解观察信息与预期信息的方面/含义。部分内容涉及模拟数据。如果我从以下逻辑模型生成结果数据:
set.seed(123)
n <- 5000
c1 <- rnorm(n,3,1.5)
c2 <- rnorm(n,5,1.75)
x <- rnorm(n,1+1.25*c1+1.75*c2,1.5)
p<-1/(1+exp(-(-13.5+log(1.5)*x+log(1.25)*c2+log(1.75)*c2)))
y <- rbinom(n,1,p)
dat<-data.frame(c1,c2,x,y)
然后,如果我理解正确,这段代码给了我观察到的信息矩阵:
a<-glm(y~x+c1+c2,data=dat,family=binomial(link="logit"))
solve(vcov(a))
但我无法弄清楚如何获得预期的信息矩阵。
答案 0 :(得分:1)
但我无法弄清楚如何获得预期的信息矩阵。
首先,观察到的信息矩阵和预期的信息矩阵在这种情况下是一致的,因为您使用了规范链接函数(参见this wiki page和参考文献)。
...,如果我理解正确,这段代码给了我观察到的信息矩阵
其次,vcov
为您提供(请参阅getS3method("vcov", "glm")
和getS3method("summary", "glm")
),其中psi是分散参数,X是设计矩阵,W是工作重量。 AFAIR glm
使用的IWLS方法在使用非规范链接函数时也相当于Fischer评分。因此,这将是预期的信息矩阵,而不是观察到的信息矩阵。