它应该是什么格式?我说的是二元逻辑回归,我的因变量已经只有1和0。
> str(data$returnShipment)
int [1:481092] 0 1 1 0 0 0 0 1 1 1 ...
整数是正确的还是应该是什么? 感谢
答案 0 :(得分:4)
您所要做的就是阅读帮助文件。来自?glm
:
典型的预测变量形式为
response ~ terms
response
(数字)响应向量和terms
是一系列术语 指定响应的线性预测器。对于
binomial
和quasibinomial
家庭,回复也可以 指定为一个因子(当第一个级别表示失败时,全部 其他成功)或作为一个双列矩阵与列给出 成功和失败的数量。
因此它可以是数字1和0,因子或两列,表示每个预测变量值的成功和失败次数。
答案 1 :(得分:2)
响应变量应该只包含0和1(所以整数是可以的)。此外,响应必须只有一列数字,[与两个向量(成功和失败)绑定在一起形成响应的比例数据相反]。