快速累积和和运算符

时间:2019-04-18 11:14:24

标签: python numpy cumulative-sum

我有一个预测算法,可以使用以下代码来处理时间序列在给定范围内的趋势:

import numpy as np
horizon = 91
phi = 0.2
trend = -0.004
trend_up_to_horizon = np.cumsum(phi ** np.arange(horizon) + 1) * self.trend

在此示例中,前两个trend_up_horizon值是:

array([-0.008 , -0.0128])

是否有一种计算上更快的方法来实现这一目标?目前,我估计使用np.cumsum方法和**运算符会花费很长时间。

感谢您的帮助

2 个答案:

答案 0 :(得分:2)

您可以更快地执行此操作。正如您已经假设的那样,(不必要的)电源操作员是这里的主要问题。

除此以外,Numpy还没有对power(float64,int64)的特殊实现,其中指数是一个小的正整数。相反,Numpy总是计算power(float64,float64),这是一个更加复杂的任务。

Numba和Numexpr对于简单情况下的power(float64,int64)具有特殊的实现,因此让我们首先尝试一下。

第一种方法

import numpy as np
import numba as nb

horizon = 91
phi = 0.2
trend = -0.004

@nb.njit()
def pow_cumsum(horizon,phi,trend):
    out=np.empty(horizon)
    csum=0.
    for i in range(horizon):
        csum+=phi**i+1
        out[i]=csum*trend
    return out

如前所述,在不需要直接计算功效之前,可以对算法进行重写以完全避免这种情况。

第二种方法

@nb.njit()
def pow_cumsum_2(horizon,phi,trend):
    out=np.empty(horizon)

    out[0]=2.*trend
    TMP=2.
    val=phi
    for i in range(horizon-1):
        TMP=(val+1+TMP)
        out[i+1]=TMP*trend
        val*=phi
    return out

时间

%timeit np.cumsum(phi ** np.arange(horizon) + 1) * trend
7.44 µs ± 89.1 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)
%timeit pow_cumsum(horizon,phi,trend)
882 ns ± 4.91 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)
%timeit pow_cumsum_2(horizon,phi,trend)
559 ns ± 3.8 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)

答案 1 :(得分:1)

您可以使用Cython使其速度更快一点,但这并不多

在基本的%timeit上运行np.cumsum(phi ** np.arange(horizon) + 1) * trend时说,我的笔记本电脑需要17.5µs,这不算什么

与之等效的Cython版本是:

import numpy as np
cimport numpy as np
cimport cython

@cython.boundscheck(False)
def do_cumsum(size_t horizon, double phi, double trend):
    cdef np.ndarray[double, ndim=1] out = np.empty(horizon, dtype=np.float)
    cdef double csum = 0
    cdef int i

    for i in range(horizon):
        csum += phi ** i + 1
        out[i] = csum * trend

    return out

这将do_cumsum(horizon, phi, trend)的时间降低到6.9µs,而如果我切换到单精度/ 32位浮点,则时间将降低到4.5µs

那是说,微秒并不多,您最好集中精力在其他地方