我试图了解如何使用scikit-learn(或其他模块)复制R中的poly()函数。
例如,假设我在R中有一个向量:
a <- c(1:10)
我想生成三次多项式:
polynomial <- poly(a, 3)
我得到以下内容:
1 2 3
[1,] -0.49543369 0.52223297 -0.4534252
[2,] -0.38533732 0.17407766 0.1511417
[3,] -0.27524094 -0.08703883 0.3778543
[4,] -0.16514456 -0.26111648 0.3346710
[5,] -0.05504819 -0.34815531 0.1295501
[6,] 0.05504819 -0.34815531 -0.1295501
[7,] 0.16514456 -0.26111648 -0.3346710
[8,] 0.27524094 -0.08703883 -0.3778543
[9,] 0.38533732 0.17407766 -0.1511417
[10,] 0.49543369 0.52223297 0.4534252
我是python的新手,我正在尝试了解如何利用sklearn中的PolynomiaFeatures
函数来复制它。我花了一些时间查看PolynomialFeatures
文档中的示例,但我仍然有点困惑。
非常感谢任何见解。谢谢!
答案 0 :(得分:5)
事实证明,您可以通过执行矩阵的QR分解来复制R poly(x,p)
函数的结果,该矩阵的列是来自第0次幂的输入向量x
的幂(所有)直到p
次幂。 Q矩阵减去第一个常量列,为您提供所需的结果。
因此,以下内容应该有效:
import numpy as np
def poly(x, p):
x = np.array(x)
X = np.transpose(np.vstack((x**k for k in range(p+1))))
return np.linalg.qr(X)[0][:,1:]
特别是:
In [29]: poly([1,2,3,4,5,6,7,8,9,10], 3)
Out[29]:
array([[-0.49543369, 0.52223297, 0.45342519],
[-0.38533732, 0.17407766, -0.15114173],
[-0.27524094, -0.08703883, -0.37785433],
[-0.16514456, -0.26111648, -0.33467098],
[-0.05504819, -0.34815531, -0.12955006],
[ 0.05504819, -0.34815531, 0.12955006],
[ 0.16514456, -0.26111648, 0.33467098],
[ 0.27524094, -0.08703883, 0.37785433],
[ 0.38533732, 0.17407766, 0.15114173],
[ 0.49543369, 0.52223297, -0.45342519]])
In [30]:
答案 1 :(得分:1)
K. A. Buhr的答案是完整而完整的。
R poly函数还计算不同程度成员的交互。这就是我寻找R poly等价物的原因
sklearn.preprocessing.PolynomialFeatures似乎提供了这样的结果,您可以在%M
步后获取正交矩阵。
这样的事情:
np.linalg.qr(X)[0][:,1:]
结果:
import numpy as np
import pprint
import sklearn.preprocessing
PP = pprint.PrettyPrinter(indent=4)
MATRIX = np.array([[ 4, 2],[ 2, 3],[ 7, 4]])
poly = sklearn.preprocessing.PolynomialFeatures(2)
PP.pprint(MATRIX)
X = poly.fit_transform(MATRIX)
PP.pprint(X)