用于生成NumPy矩阵的矢量化解决方案

时间:2019-06-02 18:31:03

标签: python numpy vectorization

我正在寻找一些内置的NumPy模块或某种矢量化方法,以通过n矩阵为n获得n>1。唯一关键的是给定行的最后一个元素充当下一行的第一个元素。

n = 2
# array([[1, 2], 
#        [2, 3]])

n = 3
# array([[1, 2, 3], 
#        [3, 4, 5], 
#        [5, 6, 7]])

n = 4
# array([[1, 2, 3, 4], 
#        [4, 5, 6, 7], 
#        [7, 8, 9, 10], 
#        [10, 11, 12, 13]])

我的尝试使用列表推导。同样,也可以用扩展的for循环语法编写。

import numpy as np
n = 4
arr = np.array([[(n-1)*j+i for i in range(1, n+1)] for j in range(n)])
# array([[ 1,  2,  3,  4],
#        [ 4,  5,  6,  7],
#        [ 7,  8,  9, 10],
#        [10, 11, 12, 13]])

4 个答案:

答案 0 :(得分:3)

如果您想使事情保持简单(并且易于阅读),则应该这样做:

def ranged_mat(n):
    out = np.arange(1, n ** 2 + 1).reshape(n, n)
    out -= np.arange(n).reshape(n, 1)
    return out

简单地构建从1到n²的所有数字,将它们重塑为所需的块形状,然后从每一行中减去行号。

这与Divakar的ranged_mat_v2相同,但是我喜欢对中间数组形状进行显式表示。并非每个人都是NumPy广播规则的专家。

答案 1 :(得分:2)

方法1

我们可以利用基于np.lib.stride_tricks.as_stridedscikit-image's view_as_windows来获取滑动窗口。 More info on use of as_strided based view_as_windows

此外,它接受一个step参数,非常适合此问题。因此,实现将是-

from skimage.util.shape import view_as_windows

def ranged_mat(n):
    r  = np.arange(1,n*(n-1)+2)
    return view_as_windows(r,n,step=n-1)

样品运行-

In [270]: ranged_mat(2)
Out[270]: 
array([[1, 2],
       [2, 3]])

In [271]: ranged_mat(3)
Out[271]: 
array([[1, 2, 3],
       [3, 4, 5],
       [5, 6, 7]])

In [272]: ranged_mat(4)
Out[272]: 
array([[ 1,  2,  3,  4],
       [ 4,  5,  6,  7],
       [ 7,  8,  9, 10],
       [10, 11, 12, 13]])

方法2

另一个与outer-broadcasted-addition-

def ranged_mat_v2(n):
    r = np.arange(n)
    return (n-1)*r[:,None]+r+1

方法3

我们还可以使用支持多核处理的numexpr module,从而在大型n's上实现更高的效率-

import numexpr as ne

def ranged_mat_v3(n):
    r = np.arange(n)
    r2d = (n-1)*r[:,None]
    return ne.evaluate('r2d+r+1')

使用切片使我们的内存效率更高-

def ranged_mat_v4(n):
    r  = np.arange(n+1)
    r0 = r[1:]
    r1 = r[:-1,None]*(n-1)
    return ne.evaluate('r0+r1')

时间-

In [423]: %timeit ranged_mat(10000)
273 ms ± 3.42 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)

In [424]: %timeit ranged_mat_v2(10000)
316 ms ± 2.03 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)

In [425]: %timeit ranged_mat_v3(10000)
176 ms ± 85.9 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)

In [426]: %timeit ranged_mat_v4(10000)
154 ms ± 82.8 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)

答案 2 :(得分:1)

还有如下的np.from函数。 docs here

def func(n):
    return np.fromfunction(lambda r,c: (n-1)*r+1+c, shape=(n,n))

它具有一个根据索引值计算数组的函数。

答案 3 :(得分:1)

为此,我们可以使用NumPy strides

def as_strides(n):
    m = n**2 - (n-1)
    a = np.arange(1, m+1)
    s = a.strides[0]
    return np.lib.stride_tricks.as_strided(a, shape=(n,n), strides=((n-1)*s,s))

as_strides(2)
rray([[1, 2],
       [2, 3]])

as_strides(3)
array([[1, 2, 3],
       [3, 4, 5],
       [5, 6, 7]])

as_strides(4)
array([[ 1,  2,  3,  4],
       [ 4,  5,  6,  7],
       [ 7,  8,  9, 10],
       [10, 11, 12, 13]])