假设n维的观察阵列被重新整形为2d阵列,每行是一个观察集。使用这种重塑方法,np.polyfit
可以计算整个ndarray(矢量化)的二阶拟合系数:
fit = np.polynomial.polynomialpolyfit(X, Y, 2)
其中Y是形状(304000,21),X是矢量。这导致(304000,3)系数数组合适。
使用迭代器可以为每一行调用np.polyval(fit, X)
。当存在矢量化方法时,这是低效的。 fit
结果可以在没有迭代的情况下应用于整个观察数组吗?如果是这样,怎么样?
这与this SO问题一致。
答案 0 :(得分:7)
np.polynomial.polynomial.polyval
采用多维系数数组:
>>> x = np.random.rand(100)
>>> y = np.random.rand(100, 25)
>>> fit = np.polynomial.polynomial.polyfit(x, y, 2)
>>> fit.shape # 25 columns of 3 polynomial coefficients
(3L, 25L)
>>> xx = np.random.rand(50)
>>> interpol = np.polynomial.polynomial.polyval(xx, fit)
>>> interpol.shape # 25 rows, each with 50 evaluations of the polynomial
(25L, 50L)
当然:
>>> np.all([np.allclose(np.polynomial.polynomial.polyval(xx, fit[:, j]),
... interpol[j]) for j in range(25)])
True
答案 1 :(得分:0)
np.polynomial.polynomial.polyval
是一种非常精细(且方便)的方法,可以有效地评估多项式拟合。
然而,如果你正在寻找'最快',那么简单地构造多项式输入并使用基本的numpy矩阵乘法函数会导致稍快(大约快4倍)的计算速度。
使用与上面相同的设置,我们将创建25个不同的线路配件。
>>> num_samples = 100000
>>> num_lines = 100
>>> x = np.random.randint(0,100,num_samples)
>>> y = np.random.randint(0,100,(num_samples, num_lines))
>>> fit = np.polyfit(x,y,deg=2)
>>> xx = np.random.randint(0,100,num_samples*10)
polyval
函数res1 = np.polynomial.polynomial.polyval(xx, fit)
inputs = np.array([np.power(xx,d) for d in range(len(fit))])
res2 = fit.T.dot(inputs)
使用上面相同的参数......
%timeit _ = np.polynomial.polynomial.polyval(xx, fit)
1 loop, best of 3: 247 ms per loop
%timeit inputs = np.array([np.power(xx, d) for d in range(len(fit))]);_ = fit.T.dot(inputs)
10 loops, best of 3: 72.8 ms per loop
击败死马......
意味着效率提升约3.61倍。速度波动可能来自后台的随机计算机进程。