我正在尝试运行多元分段GLM,并且在同一模型中冻结了一些系数,但是显然我使用了错误的语法,因为结果无法正确显示。
以下是公式的示例:
pricing_1_formula = "pure_premium ~ I((channel_model == 'DIR')*1.1) + I((channel_model == 'IA')*1) + \
I((channel_model == 'EA')*1) + I((credit_model_52778 ==1)*credit_model_52778) + \
I((credit_model_52778 ==2)*credit_model_52778) + I((credit_model_52778 ==3)*credit_model_52778) +\
I((credit_model_52778 >= 500)*credit_model_52778) + credit_model_52778"
要对此进行分解,信用模型实际上具有评分和编码变量。 “ 1”,“ 2”和“ 3”是“不适用”的代码,因为credit_score不适用于该观察结果,没有匹配项和稀疏文件。我希望他们按照模型浮动,然后将线条从1开始与其他所有分数的1拟合为500。
我想使通道的系数保持恒定,因此任何来自“ DIR”通道的观测值的系数为1.1(对于GLM摘要,该系数的值为1.,对于具有“ IA”和“ EA'。
但是,“ DIR”的系数返回为-29.1108
。我不确定语法应该是什么。