Question

我正在尝试运行多元分段GLM，并且在同一模型中冻结了一些系数，但是显然我使用了错误的语法，因为结果无法正确显示。

以下是公式的示例：

pricing_1_formula = "pure_premium ~ I((channel_model == 'DIR')*1.1) + I((channel_model == 'IA')*1) + \
         I((channel_model == 'EA')*1) + I((credit_model_52778 ==1)*credit_model_52778) + \
         I((credit_model_52778 ==2)*credit_model_52778) + I((credit_model_52778 ==3)*credit_model_52778) +\
         I((credit_model_52778 >= 500)*credit_model_52778) + credit_model_52778"

要对此进行分解，信用模型实际上具有评分和编码变量。 “ 1”，“ 2”和“ 3”是“不适用”的代码，因为credit_score不适用于该观察结果，没有匹配项和稀疏文件。我希望他们按照模型浮动，然后将线条从1开始与其他所有分数的1拟合为500。

我想使通道的系数保持恒定，因此任何来自“ DIR”通道的观测值的系数为1.1（对于GLM摘要，该系数的值为1.，对于具有“ IA”和“ EA'。

但是，“ DIR”的系数返回为-29.1108。我不确定语法应该是什么。

使用patsy和statsmodels的正确的分段回归和冻结系数语法是什么？

0 个答案: