r - 部署逻辑回归，其中变量在R中被“切割”

部署逻辑回归，其中变量在R中被“切割”

时间：2016-04-15 19:51:25

标签： r logistic-regression

我使用glm的逻辑回归模型看起来像这样：

glm(formula = output ~ cut(X1,c(1,2,3,4,5,6,7)) + X2 + X3 + X4 + X5 + X1:term + term:X5 - 1, family="binomial", data=mydata)

当我使用summary(glm)时，我会为每个X1剪切获取参数输出。假设我想实现/部署这个模型。如何处理每个'cut'派生参数？例如，如果值介于1和2之间，我只需使用与2相关联的参数乘以该值并设置所有其他参数（因为该值不在其范围内）到0？任何见解都表示赞赏。

1 个答案:

答案 0 :(得分：1)

分类变量（例如您使用cut生成的变量）在回归中变为指标（AKA 虚拟变量）。如果您的值介于1和2之间，那么它的精确值并不重要 - 您已选择丢弃模型的信息。您只需添加与1对2范围相关联的参数（如果您想以这种方式考虑它，则为1）并忽略所有其他参数（如果您想以这种方式考虑，则忽略0次）。 / p>

这不是一个真正的编程或特定于R的问题 - 您使用R来存储变量并适合您的模型是偶然的。任何有关分类变量的回归教程都应该涵盖这一点。 This one looks all right，或者this one (pdf link)。