如何将和的商作为R的回归的因变量加权?

时间:2011-09-12 21:21:11

标签: r statistics

编辑 - 重写了问题,因为原文没有意义:

在R中 - 我如何获得一个lm拟合模型,该模型是由第三个因子变量分组的两个变量的和的商,但是对某些条目进行加权比其他变量更多?数据如下:

Browser       Visits    Clicks
Chrome         100       25
Chrome         89        40
Chrome         10        0
Safari         40        10
Safari         30        2    

从评论中这是通过访问加权的WLS回归的命令,但我不认为我正在使用权重函数,因为我不知道错误如何与访问相关,只是它们是

fit <- lm(Clicks/Visits ~ Browser, weights=(visits/sum(visits)))

1 个答案:

答案 0 :(得分:3)

您要求的是费率模型,即每个风险数字的事件。这通常通过将过程建模为泊松分布的事件集来实现:

    dat <- read.table(textConnection("Browser       Visits    Clicks
 Chrome         100       25
 Chrome         89        40
 Chrome         10        0
 Safari         40        10
 Safari         30        2"), header=TRUE)

 dat$CperV <- with(dat, Clicks/Visits)
    dat


 glm(CperV ~ Browser, data=dat, family = "poisson")

Call:  glm(formula = CperV ~ Browser, family = "poisson", data = dat)

Coefficients:
  (Intercept)  BrowserSafari  
       -1.456         -0.387  

Degrees of Freedom: 4 Total (i.e. Null);  3 Residual
Null Deviance:      0.772 
Residual Deviance: 0.7379   AIC: Inf 
    Residual Deviance: 0.1182   AIC: 1.467 

> exp(-1.456  ) # estimated rate for nonSafari Visits
[1] 0.2331671
> exp(-1.456-0.387 ) # estimated rate for Safari Visits
[1] 0.1583417
> mean(dat[dat$Browser=="Safari",  "CperV"])  # actual means
[1] 0.1583333
> mean(dat[dat$Browser!="Safari",  "CperV"])  # actual means
[1] 0.2331461