我正在使用保险数据,因为我有很多数据要使用汇总数据。在文献中,我见过用个人数据或汇总数据制作的模型。在this website上,解释说,对于分组和单个数据,模型系数应该相同,并且它可以正常工作。
现在我想使用像
这样的模型formula=as.formula(Payments_2016~offset(log(Payments_2015))+Cofactor)
我用
尝试过glm(data,formula,familiy=Gamma(link="log"),weights=N)
以及偏移项中的一些组合,但是分组和未分组数据的结果系数不相同。 (使用sum作为偏移项的聚合函数和网站上提出的权重的均值函数)
道歉,如果这是一个愚蠢的问题,我不是统计学家,也不完全理解这个深度的glm算法。
# GAMMA REGRESSION
set.seed(123457)
y1 <- rpois(10, lambda=13)
y2 <- rpois(20, lambda=14)
y3 <- rpois(30, lambda=15)
y4 <- rpois(40, lambda=16)
y5 <- rpois(50, lambda=7)
y6 <- rpois(60, lambda=8)
y <- c(y1,y2,y3,y4,y5,y6)
x1 <- c(rep(1,10),rep(2,20),rep(3,30),rep(1,40),rep(2,50),rep(3,60))
x2 <- c(rep(1,10),rep(1,20),rep(1,30),rep(2,40),rep(2,50),rep(2,60))
# GROUPED DATA
ytot <- c(sum(y1),sum(y2),sum(y3),sum(y4),sum(y5),sum(y6))
x1tot <- c(1,2,3,1,2,3)
x2tot <- c(1,1,1,2,2,2)
Etot <- c(10,20,30,40,50,60)
yavg <- ytot/Etot
# GAMMA REGRESSION COMPARISON OF INDIVIDUAL TO GROUPED DATA
summary(glm(y ~ factor(x1)+factor(x2),Gamma(link=log)))
summary(glm(yavg ~ factor(x1tot)+factor(x2tot),weights=Etot,Gamma(link=log)))
我想:
# GAMMA REGRESSION COMPARISON OF INDIVIDUAL TO GROUPED DATA
y1 <- rpois(10, lambda=15)
y2 <- rpois(20, lambda=15)
y3 <- rpois(30, lambda=15)
y4 <- rpois(40, lambda=15)
y5 <- rpois(50, lambda=15)
y6 <- rpois(60, lambda=15)
yoff <- c(y1,y2,y3,y4,y5,y6)
ytotoff <- c(sum(y1),sum(y2),sum(y3),sum(y4),sum(y5),sum(y6))
Etotoff <- c(10,20,30,40,50,60)
yavgoff <- ytotoff/Etotoff
summary(glm(y ~ factor(x1)+factor(x2),offset=log(yo),Gamma(link=log)))
summary(glm(yavg ~ factor(x1tot)+factor(x2tot),weights=Etot,offset=log(yoavg),Gamma(link=log)))