变量的二次变换

时间:2016-01-03 15:39:17

标签: machine-learning scikit-learn coordinate-transformation

我正在尝试学习一些机器学习,并想知道什么是数据的二次和三次转换以及它是如何完成的? forum上的一个人正在谈论它,我想知道变量的转换是什么以及它是如何完成的。 谢谢

1 个答案:

答案 0 :(得分:7)

多项式特征(二次,三次等)用于减少模型中的偏差并允许术语之间的相互作用。在scikit-learn中,它被实现为sklearn.preprocessing.PolynomialFeatures中的转换。

这个想法是,如果您有三个功能abc。通过展开(a + b + c) ^ 2生成二次特征。因此,a^2b^2 c^2a*ba*cb*c将成为二次特征的集合。

在scikit-learn PolynomialFeatures中,当参数degree通过时,将创建所有达到该度数的术语。

这通常在构建线性模型之前使用。它允许较低的偏差,但它会非常快速地增加功能集的大小。