我使用glm
的逻辑回归模型看起来像这样:
glm(formula = output ~ cut(X1,c(1,2,3,4,5,6,7)) + X2 + X3 + X4 + X5 + X1:term + term:X5 - 1, family="binomial", data=mydata)
当我使用summary(glm)
时,我会为每个X1
剪切获取参数输出。假设我想实现/部署这个模型。如何处理每个'cut'派生参数?例如,如果值介于1
和2
之间,我只需使用与2
相关联的参数乘以该值并设置所有其他参数(因为该值不在其范围内)到0
?任何见解都表示赞赏。
答案 0 :(得分:1)
分类变量(例如您使用cut
生成的变量)在回归中变为指标(AKA 虚拟变量)。如果您的值介于1和2之间,那么它的精确值并不重要 - 您已选择丢弃模型的信息。您只需添加与1对2范围相关联的参数(如果您想以这种方式考虑它,则为1)并忽略所有其他参数(如果您想以这种方式考虑,则忽略0次)。 / p>
这不是一个真正的编程或特定于R的问题 - 您使用R来存储变量并适合您的模型是偶然的。任何有关分类变量的回归教程都应该涵盖这一点。 This one looks all right,或者this one (pdf link)。