GLM组数据因素

时间:2017-09-25 19:08:09

标签: r regression aggregate glm

我正在使用保险数据,因为我有很多数据要使用汇总数据。在文献中,我见过用个人数据或汇总数据制作的模型。在this website上,解释说,对于分组和单个数据,模型系数应该相同,并且它可以正常工作。

现在我想使用像

这样的模型
formula=as.formula(Payments_2016~offset(log(Payments_2015))+Cofactor)

我用

尝试过
glm(data,formula,familiy=Gamma(link="log"),weights=N) 

以及偏移项中的一些组合,但是分组和未分组数据的结果系数不相同。 (使用sum作为偏移项的聚合函数和网站上提出的权重的均值函数)

道歉,如果这是一个愚蠢的问题,我不是统计学家,也不完全理解这个深度的glm算法。

# GAMMA REGRESSION
set.seed(123457)
y1 <- rpois(10, lambda=13)
y2 <- rpois(20, lambda=14)
y3 <- rpois(30, lambda=15)
y4 <- rpois(40, lambda=16)
y5 <- rpois(50, lambda=7)
y6 <- rpois(60, lambda=8)
y <- c(y1,y2,y3,y4,y5,y6)  
x1 <- c(rep(1,10),rep(2,20),rep(3,30),rep(1,40),rep(2,50),rep(3,60))
x2 <- c(rep(1,10),rep(1,20),rep(1,30),rep(2,40),rep(2,50),rep(2,60))
# GROUPED DATA
ytot <- c(sum(y1),sum(y2),sum(y3),sum(y4),sum(y5),sum(y6))
x1tot <- c(1,2,3,1,2,3)
x2tot <- c(1,1,1,2,2,2)
Etot <- c(10,20,30,40,50,60)
yavg <- ytot/Etot
#  GAMMA REGRESSION COMPARISON OF INDIVIDUAL TO GROUPED DATA
summary(glm(y ~ factor(x1)+factor(x2),Gamma(link=log)))
summary(glm(yavg ~    factor(x1tot)+factor(x2tot),weights=Etot,Gamma(link=log)))

我想:

#  GAMMA REGRESSION COMPARISON OF INDIVIDUAL TO GROUPED DATA

y1 <- rpois(10, lambda=15)
y2 <- rpois(20, lambda=15)
y3 <- rpois(30, lambda=15)
y4 <- rpois(40, lambda=15)
y5 <- rpois(50, lambda=15)
y6 <- rpois(60, lambda=15)
yoff <- c(y1,y2,y3,y4,y5,y6) 
ytotoff <- c(sum(y1),sum(y2),sum(y3),sum(y4),sum(y5),sum(y6))
Etotoff <- c(10,20,30,40,50,60)
yavgoff <- ytotoff/Etotoff  

summary(glm(y ~ factor(x1)+factor(x2),offset=log(yo),Gamma(link=log)))
summary(glm(yavg ~    factor(x1tot)+factor(x2tot),weights=Etot,offset=log(yoavg),Gamma(link=log)))

0 个答案:

没有答案