使用patsy和statsmodels的正确的分段回归和冻结系数语法是什么?

时间:2019-05-07 12:24:56

标签: python statsmodels patsy

我正在尝试运行多元分段GLM,并且在同一模型中冻结了一些系数,但是显然我使用了错误的语法,因为结果无法正确显示。

以下是公式的示例:

pricing_1_formula = "pure_premium ~ I((channel_model == 'DIR')*1.1) + I((channel_model == 'IA')*1) + \
         I((channel_model == 'EA')*1) + I((credit_model_52778 ==1)*credit_model_52778) + \
         I((credit_model_52778 ==2)*credit_model_52778) + I((credit_model_52778 ==3)*credit_model_52778) +\
         I((credit_model_52778 >= 500)*credit_model_52778) + credit_model_52778"

要对此进行分解,信用模型实际上具有评分和编码变量。 “ 1”,“ 2”和“ 3”是“不适用”的代码,因为credit_score不适用于该观察结果,没有匹配项和稀疏文件。我希望他们按照模型浮动,然后将线条从1开始与其他所有分数的1拟合为500。

我想使通道的系数保持恒定,因此任何来自“ DIR”通道的观测值的系数为1.1(对于GLM摘要,该系数的值为1.,对于具有“ IA”和“ EA'。

但是,“ DIR”的系数返回为-29.1108。我不确定语法应该是什么。

0 个答案:

没有答案