我正在尝试使用numpy来评估多项式(3度)。 我发现通过更简单的python代码来实现它会更有效率。
import numpy as np
import timeit
m = [3,7,1,2]
f = lambda m,x: m[0]*x**3 + m[1]*x**2 + m[2]*x + m[3]
np_poly = np.poly1d(m)
np_polyval = lambda m,x: np.polyval(m,x)
np_pow = lambda m,x: np.power(x,[3,2,1,0]).dot(m)
print 'result={}, timeit={}'.format(f(m,12),timeit.Timer('f(m,12)', 'from __main__ import f,m').timeit(10000))
result=6206, timeit=0.0036780834198
print 'result={}, timeit={}'.format(np_poly(12),timeit.Timer('np_poly(12)', 'from __main__ import np_poly').timeit(10000))
result=6206, timeit=0.180546045303
print 'result={}, timeit={}'.format(np_polyval(m,12),timeit.Timer('np_polyval(m,12)', 'from __main__ import np_polyval,m').timeit(10000))
result=6206, timeit=0.227771043777
print 'result={}, timeit={}'.format(np_pow(m,12),timeit.Timer('np_pow(m,12)', 'from __main__ import np_pow,m').timeit(10000))
result=6206, timeit=0.168987989426
我错过了什么吗?
numpy中还有另一种评估多项式的方法吗?
答案 0 :(得分:7)
像23年前那样我从大学图书馆查看了一份Press等人的 Numerical Recipes in C 。那本书里有很多很酷的东西,但多年来一直困扰着我的一段话,page 173 here:
我们假设您知道的永远不会评估多项式 方式:
p=c[0]+c[1]*x+c[2]*x*x+c[3]*x*x*x+c[4]*x*x*x*x;
或(更糟糕的是!),
p=c[0]+c[1]*x+c[2]*pow(x,2.0)+c[3]*pow(x,3.0)+c[4]*pow(x,4.0);
来(计算机)革命,所有人都被判有罪 犯罪行为将被立即执行,他们的计划不会被取消 是!然而,这是一个品味问题,是否写作
p = c[0]+x*(c[1]+x*(c[2]+x*(c[3]+x*c[4])));
或
p = (((c[4]*x+c[3])*x+c[2])*x+c[1])*x+c[0];
因此,如果你真的担心性能,你想尝试一下,对于更高次多项式的差异将是巨大的:
In [24]: fast_f = lambda m, x: m[3] + x*(m[1] + x*(m[2] + x*m[3]))
In [25]: %timeit f(m, 12)
1000000 loops, best of 3: 478 ns per loop
In [26]: %timeit fast_f(m, 12)
1000000 loops, best of 3: 374 ns per loop
如果你想坚持numpy,有一个更新的多项式类比我的系统上的poly1d
运行速度快2倍,但仍比前面的循环慢得多:
In [27]: np_fast_poly = np.polynomial.polynomial.Polynomial(m[::-1])
In [28]: %timeit np_poly(12)
100000 loops, best of 3: 15.4 us per loop
In [29]: %timeit np_fast_poly(12)
100000 loops, best of 3: 8.01 us per loop
答案 1 :(得分:1)
好吧,看看polyval
的实现(这是当你评估poly1d时最终被调用的函数),实现者决定包含一个显式循环似乎很奇怪......来自numpy 1.6的源代码0.2:
def polyval(p, x):
p = NX.asarray(p)
if isinstance(x, poly1d):
y = 0
else:
x = NX.asarray(x)
y = NX.zeros_like(x)
for i in range(len(p)):
y = x * y + p[i]
return y
一方面,避免电源操作应该是速度方面的优势,另一方面,python级别的循环几乎搞砸了。
这是一个替代的numpy-ish实现:
POW = np.arange(100)[::-1]
def g(m, x):
return np.dot(m, x ** POW[m.size : ])
为了提高速度,我避免在每次通话时重新创建电源阵列。另外,为了公平地对numpy进行基准测试时,你应该从numpy数组开始,而不是列表,以避免在每次调用时将列表转换为numpy的惩罚。
因此,在添加m = np.array(m)
时,我的g
只会比您的f
慢约50%。
尽管你发布的例子比较慢,但是为了评估标量x
上的低次多项式,你实际上不能比明确的实现(比如你的f
)快得多()当然你可以,但可能没有那么多,如果不求助于编写低级代码)。但是,对于更高的学位(你必须用某种循环替换你的表达式),numpy方法(例如g
)会随着程度的增加而更快地被证明,也适用于矢量化评估,即x
是一个向量。