从numpy中的1d向量映射2d延迟向量

时间:2018-07-01 00:08:33

标签: python performance numpy

我正在尝试从1D向量生成2D向量,其中元素沿行沿每一行递增。

我希望我的输入看起来像这样:

input:
t = [t1, t2, t3, t4, t5]

out = 
[t5,  0,  0,  0,  0]
[t4, t5,  0,  0,  0]
[t3, t4, t5,  0,  0]
[t2, t3, t4, t5,  0]
[t1, t2, t3, t4, t5]
[ 0, t1, t2, t3, t4]
[ 0,  0, t1, t2, t3]
[ 0,  0,  0, t1, t2]
[ 0,  0,  0,  0, t1]

我不知道不使用for循环即可执行此操作的方法,而计算效率对于将其用于此任务的任务很重要。有没有办法做到这一点而无需for循环?

这是我使用for循环的代码:

import numpy as np

t = np.linspace(-3, 3, 7)
z = np.zeros((2*len(t) - 1, len(t)))

diag = np.arange(len(t))
for index, val in enumerate(np.flip(t, 0)):
    z[diag + index, diag] = val

print(z)

3 个答案:

答案 0 :(得分:9)

您在此处要求的是Toeplitz Matrix,即:

  

一个矩阵,其中从左到右的每个下降对角线都是恒定的

一个区别是您想要矩阵的下三角形。

您碰巧很幸运,可以使用scipy.linalg.toeplitz来构建矩阵,然后使用 np.tril 访问下三角形。

import numpy as np
from scipy.linalg import toeplitz

v = np.array([1, 2, 3, 4, 5])
t = np.pad(v[::-1], (0, 4), mode='constant')

求解矩阵并访问下部三角形:

np.tril(toeplitz(t, v))

还有我们的输出!

array([[5, 0, 0, 0, 0],
       [4, 5, 0, 0, 0],
       [3, 4, 5, 0, 0],
       [2, 3, 4, 5, 0],
       [1, 2, 3, 4, 5],
       [0, 1, 2, 3, 4],
       [0, 0, 1, 2, 3],
       [0, 0, 0, 1, 2],
       [0, 0, 0, 0, 1]])

要泛化此方法,只需从t的形状计算出v的必要填充:

v = # any one dimension array
t = np.pad(v[::-1], (0, v.shape[0]-1), mode='constant')

答案 1 :(得分:1)

不知道非循环方法,但是您可以使用rollcolumn_stack来加快速度。

v = np.array([1, 2, 3, 4, 5])
t = np.pad(v[::-1], (0, 4), mode='constant')

np.column_stack([np.roll(t, i) for i in range(len(v))]) 
array([[5, 0, 0, 0, 0],
       [4, 5, 0, 0, 0],
       [3, 4, 5, 0, 0],
       [2, 3, 4, 5, 0],
       [1, 2, 3, 4, 5],
       [0, 1, 2, 3, 4],
       [0, 0, 1, 2, 3],
       [0, 0, 0, 1, 2],
       [0, 0, 0, 0, 1]])

答案 2 :(得分:1)

这是利用strides-tricks的一种矢量化方法,该方法仅将视图用于填充零的数组中,并成为其内存效率高且性能卓越的视图-

def map2D(a):
    n = len(a)
    p = np.zeros(n-1,dtype=a.dtype)
    a_ext = np.r_[p,a,p]
    s0 = a_ext.strides[0]
    strided = np.lib.stride_tricks.as_strided
    return strided(a_ext[-n:], (len(a_ext)-n+1,n), (-s0,s0), writeable=False)

样品运行-

In [81]: a = np.array([2,5,6,7,9])

In [82]: map2D(a)
Out[82]: 
array([[9, 0, 0, 0, 0],
       [7, 9, 0, 0, 0],
       [6, 7, 9, 0, 0],
       [5, 6, 7, 9, 0],
       [2, 5, 6, 7, 9],
       [0, 2, 5, 6, 7],
       [0, 0, 2, 5, 6],
       [0, 0, 0, 2, 5],
       [0, 0, 0, 0, 2]])

如果需要输出具有自己的存储空间,请使用.copy()

5k元素数组上的时间-

In [83]: a = np.random.randint(0,9,(5000))

# From this post's soln
In [84]: %timeit map2D(a)
10000 loops, best of 3: 26.3 µs per loop

# If you need output with its own memory space
In [97]: %timeit map2D(a).copy()
10 loops, best of 3: 43.6 ms per loop

# @user3483203's soln
In [87]: %%timeit
    ...: t = np.pad(a[::-1], (0, len(a)-1), mode='constant')
    ...: out = np.tril(toeplitz(t, a))
1 loop, best of 3: 264 ms per loop

# @coldspeed's soln
In [89]: %%timeit
    ...: t = np.pad(a[::-1], (0, len(a)-1), mode='constant')
    ...: out = np.column_stack([np.roll(t, i) for i in range(len(a))])
1 loop, best of 3: 336 ms per loop