我遇到了一个问题,需要分析电影的长度,电影的价格与其在视频流媒体平台上的销售之间的关系。现在,我有两个选择可以将销售量化为我的因变量:
如果我使用卖出率,我基本上会使用线性回归
selling rate= beta_0 + beta_1*length + beta_2*price + beta_3*length*price
但是如果要求我使用选项1时,我的响应是二进制输出,并且我假设我需要切换到逻辑回归,那么标准错误将如何变化?标准错误会被低估吗?
答案 0 :(得分:0)
您的SE的规模将有所不同,但是如果您对连续结果产生重大影响,则很有可能会从二元逻辑中获得相同的推论。逻辑几乎“丢弃”了响应中的所有可变性,因此它具有相对较低的功效。正如SweetSpot所说,由于对结果范围的限制,您应该将其视为一个问题。也就是说,您不希望有一个模型可以给您带来负面的计数/利率。另外,方差估计也需要注意。考虑将glm与family = binomial
一起使用,是/否出售结果,family = poisson
则用于计数/比率。回归logistic,poisson和negative binomial的UCLA网页是一个很好的起点。对于那些希望在没有证明的情况下进行简洁写作的人来说,最好的书是Agresti的Introduction to Categorical Data Analysis。