用numpy滚动最大

时间:2018-09-07 08:35:49

标签: python numpy

这会在长度为A的滑动窗口上计算K的“滚动最大值”(类似于滚动平均值):

import numpy as np
A = np.random.rand(100000)
K = 10
rollingmax = np.array([max(A[j:j+K]) for j in range(len(A)-K)])

但是我认为在性能方面远非最佳。

我知道pandas库具有rolling_max,但是在我的项目中,我不想使用这种新的依赖关系。

问题:是否有一种简单的方法可以仅使用numpy计算滚动最大值?

2 个答案:

答案 0 :(得分:3)

这里的解决方案与Divakar's answer完全相似(对他完全信任),但是在这种情况下,数组的最终裁剪具有不同的索引:

maximum_filter1d(A, size=K)[K//2:-((K+1)//2)]

示例:

import numpy as np
from scipy.ndimage.filters import maximum_filter1d
A = np.random.randint(0, 10, (50))
K = 5
rollingmax = np.array([max(A[j-K:j]) for j in range(K,len(A))])
rollingmax2 = np.array([max(A[j:j+K]) for j in range(len(A)-K)])
rollingmax3 = maximum_filter1d(A,size=K)[K//2:-((K+1)//2)]
print A, rollingmax, rollingmax2, rollingmax3
  

[6 7 7 9 4 5 4 7 2 0 3 3 5 9 4 6 6 1 5 2 7 5 7 7 5 6 0 9 0 5 9 3 7 1 9 5 3    7 5 1 6 9 6 0 5 1 5 5 4 9]
  [9 9 9 9 7 7 7 7 7 5 9 9 9 9 9 6 6 7 7 7 7 7 7 7 7 7 9 9 9 9 9 9 9 9 9 9 9 9 9 7 7    9 9 9 9 9 6 5 5]]
  [9 9 9 9 7 7 7 7 7 5 9 9 9 9 9 6 6 7 7 7 7 7 7 7 7 7 9 9 9 9 9 9 9 9 9 9 9 9 9 7 7    9 9 9 9 9 6 5 5]]
  [9 9 9 9 7 7 7 7 7 5 9 9 9 9 9 6 6 7 7 7 7 7 7 7 7 7 9 9 9 9 9 9 9 9 9 9 9 9 9 7 7    9 9 9 9 9 6 5 5]

答案 1 :(得分:3)

我猜想使用stridesas_strided的这个小技巧就能完成工作:

def max_rolling1(a, window,axis =1):
        shape = a.shape[:-1] + (a.shape[-1] - window + 1, window)
        strides = a.strides + (a.strides[-1],)
        rolling = np.lib.stride_tricks.as_strided(a, shape=shape, strides=strides)
        return np.max(rolling,axis=axis)

出于同战的目的,我根据您的算法定义了另一个函数:

def max_rolling2(A,K):
    rollingmax = np.array([max(A[j:j+K]) for j in range(len(A)-K)])
    return rollingmax

在我的笔记本电脑上timeit的比较结果是:

与:

A = np.random.rand(100000)
K = 10


%timeit X = max_rolling2(A,K)
170 ms ± 19.8 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
%timeit X = max_rolling1(A,K)
> 3.75 ms ± 479 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)