逻辑回归与线性回归之间的关系

时间:2020-08-08 07:12:12

标签: r linear-regression logistic-regression

我遇到了一个问题,需要分析电影的长度,电影的价格与其在视频流媒体平台上的销售之间的关系。现在,我有两个选择可以将销售量化为我的因变量:

  1. 用户是否最终购买了电影
  2. 销售率(购买电影的人数/观看预告片的人数)

如果我使用卖出率,我基本上会使用线性回归 selling rate= beta_0 + beta_1*length + beta_2*price + beta_3*length*price

但是如果要求我使用选项1时,我的响应是二进制输出,并且我假设我需要切换到逻辑回归,那么标准错误将如何变化?标准错误会被低估吗?

1 个答案:

答案 0 :(得分:0)

您的SE的规模将有所不同,但是如果您对连续结果产生重大影响,则很有可能会从二元逻辑中获得相同的推论。逻辑几乎“丢弃”了响应中的所有可变性,因此它具有相对较低的功效。正如SweetSpot所说,由于对结果范围的限制,您应该将其视为一个问题。也就是说,您不希望有一个模型可以给您带来负面的计数/利率。另外,方差估计也需要注意。考虑将glm与family = binomial一起使用,是/否出售结果,family = poisson则用于计数/比率。回归logisticpoissonnegative binomial的UCLA网页是一个很好的起点。对于那些希望在没有证明的情况下进行简洁写作的人来说,最好的书是Agresti的Introduction to Categorical Data Analysis