编辑 - 重写了问题,因为原文没有意义:
在R中 - 我如何获得一个lm拟合模型,该模型是由第三个因子变量分组的两个变量的和的商,但是对某些条目进行加权比其他变量更多?数据如下:
Browser Visits Clicks
Chrome 100 25
Chrome 89 40
Chrome 10 0
Safari 40 10
Safari 30 2
从评论中这是通过访问加权的WLS回归的命令,但我不认为我正在使用权重函数,因为我不知道错误如何与访问相关,只是它们是
fit <- lm(Clicks/Visits ~ Browser, weights=(visits/sum(visits)))
答案 0 :(得分:3)
您要求的是费率模型,即每个风险数字的事件。这通常通过将过程建模为泊松分布的事件集来实现:
dat <- read.table(textConnection("Browser Visits Clicks
Chrome 100 25
Chrome 89 40
Chrome 10 0
Safari 40 10
Safari 30 2"), header=TRUE)
dat$CperV <- with(dat, Clicks/Visits)
dat
glm(CperV ~ Browser, data=dat, family = "poisson")
Call: glm(formula = CperV ~ Browser, family = "poisson", data = dat)
Coefficients:
(Intercept) BrowserSafari
-1.456 -0.387
Degrees of Freedom: 4 Total (i.e. Null); 3 Residual
Null Deviance: 0.772
Residual Deviance: 0.7379 AIC: Inf
Residual Deviance: 0.1182 AIC: 1.467
> exp(-1.456 ) # estimated rate for nonSafari Visits
[1] 0.2331671
> exp(-1.456-0.387 ) # estimated rate for Safari Visits
[1] 0.1583417
> mean(dat[dat$Browser=="Safari", "CperV"]) # actual means
[1] 0.1583333
> mean(dat[dat$Browser!="Safari", "CperV"]) # actual means
[1] 0.2331461