部署逻辑回归,其中变量在R中被“切割”

时间:2016-04-15 19:51:25

标签: r logistic-regression

我使用glm的逻辑回归模型看起来像这样:

glm(formula = output ~ cut(X1,c(1,2,3,4,5,6,7)) + X2 + X3 + X4 + X5 + X1:term + term:X5 - 1, family="binomial", data=mydata)

当我使用summary(glm)时,我会为每个X1剪切获取参数输出。假设我想实现/部署这个模型。如何处理每个'cut'派生参数?例如,如果值介于12之间,我只需使用与2相关联的参数乘以该值并设置所有其他参数(因为该值不在其范围内)到0?任何见解都表示赞赏。

1 个答案:

答案 0 :(得分:1)

分类变量(例如您使用cut生成的变量)在回归中变为指标(AKA 虚拟变量)。如果您的值介于1和2之间,那么它的精确值并不重要 - 您已选择丢弃模型的信息。您只需添加与1对2范围相关联的参数(如果您想以这种方式考虑它,则为1)并忽略所有其他参数(如果您想以这种方式考虑,则忽略0次)。 / p>

这不是一个真正的编程或特定于R的问题 - 您使用R来存储变量并适合您的模型是偶然的。任何有关分类变量的回归教程都应该涵盖这一点。 This one looks all right,或者this one (pdf link)