1D numpy数组,对于新2D阵列中的每个连续行,向右移位

时间:2014-01-09 18:32:47

标签: python numpy

我正在尝试通过删除for循环和仅使用numpy数组来优化某些代码,因为我正在处理大型数据集。

我想采用1D numpy数组,例如:

a = [1, 2, 3, 4, 5]

并生成一个2D numpy数组,其中每列中的值沿着一个位置移动,例如在上面的情况下,我希望有一个函数返回:

[[1 2 3 4 5]
 [0 1 2 3 4]
 [0 0 1 2 3]
 [0 0 0 1 2]
 [0 0 0 0 1]]

我找到了使用步长函数执行类似生成的示例,例如:

[[1 2 3]
 [2 3 4]
 [3 4 5]]

但是我试图将我的每一列移到另一个方向。或者,可以将问题视为将a的第一个元素放在第一个对角线上,将第二个元素放在第二个对角线上,依此类推。但是,我想再次强调一下我是如何避免完全使用for,while或if循环的。任何帮助将不胜感激。

2 个答案:

答案 0 :(得分:4)

这样的矩阵是Toeplitz matrix的一个例子。您可以使用scipy.linalg.toeplitz创建它:

In [32]: from scipy.linalg import toeplitz

In [33]: a = range(1,6)

In [34]: toeplitz(a, np.zeros_like(a)).T
Out[34]: 
array([[1, 2, 3, 4, 5],
       [0, 1, 2, 3, 4],
       [0, 0, 1, 2, 3],
       [0, 0, 0, 1, 2],
       [0, 0, 0, 0, 1]])

受@ EelcoHoogendoorn的回答启发,这里的变体并没有使用与scipy.linalg.toeplitz一样多的内存:

In [47]: from numpy.lib.stride_tricks import as_strided

In [48]: a
Out[48]: array([1, 2, 3, 4, 5])

In [49]: t = as_strided(np.r_[a[::-1], np.zeros_like(a)], shape=(a.size,a.size), strides=(a.itemsize, a.itemsize))[:,::-1]

In [50]: t
Out[50]: 
array([[1, 2, 3, 4, 5],
       [0, 1, 2, 3, 4],
       [0, 0, 1, 2, 3],
       [0, 0, 0, 1, 2],
       [0, 0, 0, 0, 1]])

结果应视为"只读"阵列。否则,当您更改元素时,您会遇到一些惊喜。例如:

In [51]: t[0,2] = 99

In [52]: t
Out[52]: 
array([[ 1,  2, 99,  4,  5],
       [ 0,  1,  2, 99,  4],
       [ 0,  0,  1,  2, 99],
       [ 0,  0,  0,  1,  2],
       [ 0,  0,  0,  0,  1]])

答案 1 :(得分:2)

这是基于索引技巧的解决方案。不像已发布的toeplitz解决方案那么优雅,但如果内存消耗或性能成为一个问题,那么它应该是首选。如图所示,这也使得随后以一致的方式随后操纵矩阵的条目变得容易。

import numpy as np
a = np.arange(5)+1

def toeplitz_view(a):
    b = np.concatenate((np.zeros_like(a),a))
    i = a.itemsize
    v = np.lib.index_tricks.as_strided(b,
        shape=(len(b),)*2,
        strides=(-i, i))
    #return a view on the 'original' data as well, for manipulation
    return v[:len(a), len(a):], b[len(a):]        

v, a = toeplitz_view(a)
print v
a[0] = 10
v[2,1] = -1
print v