我正在阅读“统计学习简介”,并且已经到了讨论线性回归交互项的章节(第 3.3.2 节)。我了解添加交互项的好处以及设置交互项的理论。然而,目前尚不清楚如何在 python 中进行设置。
通过在线阅读,我了解到 sklearn 上的 PolynomialFeatures 可用于使用 interaction_only 参数创建交互项。
但是,我不确定进行线性回归的后续步骤。我拥有的数据是连续变量。
我的问题是:
我可以通过将度设置为 1(在 PolynomialFeatures 上)然后应用 fit_transform 方法来执行线性回归吗?或者我是否必须将度数设置为 2(最小值),因为我选择了多项式线性回归?例如。直线可能比二次曲线更适合模型
如果有 4 个预测变量 (x1, x2, x3, x4) 并且交互仅在 x2 和 x3 之间,如何添加交互项
注意:本书提供了一个将回归应用于直线(而非多项式)的示例。