我正在使用MadLibs线性回归训练函数来分析coef
。这样做的时候,我遇到了针对自变量的基准引用。
类似于R中的relevel()
。How to force R to use a specified factor level as reference in a regression?
MadLib是否提供任何可用于实现此目的的功能?
或者Madlib是否使用linregr_train在内部实现/运行?
我找不到可以在Madlib上为自变量指定基线的参数。
答案 0 :(得分:0)
按基线参考,您指的是分类自变量的虚拟编码参考吗?如果是,则MADlib希望在将数据传递给回归方法之前已对数据进行了编码。有关伪编码的过程,请参见Encoding Categorical Variables。 value_to_drop
参数为用户定义的参考级别提供功能。