二元逻辑回归中的因变量应该是什么格式? (对于R)

时间:2016-05-03 17:33:22

标签: r logistic-regression

它应该是什么格式?我说的是二元逻辑回归,我的因变量已经只有1和0。

> str(data$returnShipment)
 int [1:481092] 0 1 1 0 0 0 0 1 1 1 ...

整数是正确的还是应该是什么? 感谢

2 个答案:

答案 0 :(得分:4)

您所要做的就是阅读帮助文件。来自?glm

  

典型的预测变量形式为response ~ terms response   (数字)响应向量和terms是一系列术语   指定响应的线性预测器。

     

对于binomialquasibinomial家庭,回复也可以   指定为一个因子(当第一个级别表示失败时,全部   其他成功)或作为一个双列矩阵与列给出   成功和失败的数量。

因此它可以是数字1和0,因子或两列,表示每个预测变量值的成功和失败次数。

答案 1 :(得分:2)

响应变量应该只包含0和1(所以整数是可以的)。此外,响应必须只有一列数字,[与两个向量(成功和失败)绑定在一起形成响应的比例数据相反]。