Python相当于R poly()函数?

时间:2016-12-24 21:58:46

标签: python r polynomials

我试图了解如何使用scikit-learn(或其他模块)复制R中的poly()函数。

例如,假设我在R中有一个向量:

a <- c(1:10)

我想生成三次多项式:

polynomial <- poly(a, 3)

我得到以下内容:

              1           2          3
[1,] -0.49543369  0.52223297 -0.4534252
[2,] -0.38533732  0.17407766  0.1511417
[3,] -0.27524094 -0.08703883  0.3778543
[4,] -0.16514456 -0.26111648  0.3346710
[5,] -0.05504819 -0.34815531  0.1295501
[6,]  0.05504819 -0.34815531 -0.1295501
[7,]  0.16514456 -0.26111648 -0.3346710
[8,]  0.27524094 -0.08703883 -0.3778543
[9,]  0.38533732  0.17407766 -0.1511417
[10,]  0.49543369  0.52223297  0.4534252

我是python的新手,我正在尝试了解如何利用sklearn中的PolynomiaFeatures函数来复制它。我花了一些时间查看PolynomialFeatures文档中的示例,但我仍然有点困惑。

非常感谢任何见解。谢谢!

2 个答案:

答案 0 :(得分:5)

事实证明,您可以通过执行矩阵的QR分解来复制R poly(x,p)函数的结果,该矩阵的列是来自第0次幂的输入向量x的幂(所有)直到p次幂。 Q矩阵减去第一个常量列,为您提供所需的结果。

因此,以下内容应该有效:

import numpy as np

def poly(x, p):
    x = np.array(x)
    X = np.transpose(np.vstack((x**k for k in range(p+1))))
    return np.linalg.qr(X)[0][:,1:]

特别是:

In [29]: poly([1,2,3,4,5,6,7,8,9,10], 3)
Out[29]: 
array([[-0.49543369,  0.52223297,  0.45342519],
       [-0.38533732,  0.17407766, -0.15114173],
       [-0.27524094, -0.08703883, -0.37785433],
       [-0.16514456, -0.26111648, -0.33467098],
       [-0.05504819, -0.34815531, -0.12955006],
       [ 0.05504819, -0.34815531,  0.12955006],
       [ 0.16514456, -0.26111648,  0.33467098],
       [ 0.27524094, -0.08703883,  0.37785433],
       [ 0.38533732,  0.17407766,  0.15114173],
       [ 0.49543369,  0.52223297, -0.45342519]])

In [30]: 

答案 1 :(得分:1)

K. A. Buhr的答案是完整而完整的。

R poly函数还计算不同程度成员的交互。这就是我寻找R poly等价物的原因 sklearn.preprocessing.PolynomialFeatures似乎提供了这样的结果,您可以在%M步后获取正交矩阵。

这样的事情:

np.linalg.qr(X)[0][:,1:]

结果:

import numpy as np
import pprint
import sklearn.preprocessing
PP = pprint.PrettyPrinter(indent=4)

MATRIX = np.array([[ 4,  2],[ 2,  3],[ 7,  4]])
poly = sklearn.preprocessing.PolynomialFeatures(2)
PP.pprint(MATRIX)
X = poly.fit_transform(MATRIX)
PP.pprint(X)