我正在尝试学习一些机器学习,并想知道什么是数据的二次和三次转换以及它是如何完成的? forum上的一个人正在谈论它,我想知道变量的转换是什么以及它是如何完成的。 谢谢
答案 0 :(得分:7)
多项式特征(二次,三次等)用于减少模型中的偏差并允许术语之间的相互作用。在scikit-learn中,它被实现为sklearn.preprocessing.PolynomialFeatures中的转换。
这个想法是,如果您有三个功能a
,b
和c
。通过展开(a + b + c) ^ 2
生成二次特征。因此,a^2
,b^2
c^2
,a*b
,a*c
,b*c
将成为二次特征的集合。
在scikit-learn PolynomialFeatures
中,当参数degree
通过时,将创建所有达到该度数的术语。
这通常在构建线性模型之前使用。它允许较低的偏差,但它会非常快速地增加功能集的大小。