访问数组的多个元素

时间:2015-01-17 23:33:41

标签: python arrays numpy

有没有办法在一个操作中为这些元素的已知行和列获取数组元素?在每一行中,我想访问从col_start到col_end的元素(每行有不同的起始和结束索引)。每行的元素数量相同,元素是连续的。 例如:

[ . . . . | | | . . . . . ]
[ | | | . . . . . . . . . ]
[ . . | | | . . . . . . . ]
[ . . . . . . . . | | | . ]

一种解决方案是获取元素的索引(行 - 列对),而不是使用my_array [row_list,col_list]。

没有使用for循环还有其他(更简单的)方法吗?

3 个答案:

答案 0 :(得分:3)

A = np.arange(40).reshape(4,10)*.1
startend = [[2,5],[3,6],[4,7],[5,8]]
index_list = [np.arange(v[0],v[1]) + i*A.shape[1] 
                 for i,v in enumerate(startend)]
# [array([2, 3, 4]), array([13, 14, 15]), array([24, 25, 26]), array([35, 36, 37])]
A.flat[index_list]
制造

array([[ 0.2,  0.3,  0.4],
       [ 1.3,  1.4,  1.5],
       [ 2.4,  2.5,  2.6],
       [ 3.5,  3.6,  3.7]])

这仍然有一个迭代,但它是一个相当基本的列表。 我正在为A的扁平1d版本编制索引。 np.take(A, index_list)也有效。

如果行间隔大小不同,我可以使用np.r_来连接它们。这不是绝对必要的,但是在从多个区间和值构建索引时很方便。

A.flat[np.r_[tuple(index_list)]]
# array([ 0.2,  0.3,  0.4,  1.3,  1.4,  1.5,  2.4,  2.5,  2.6,  3.5,  3.6, 3.7])

idx使用的ajcr可以在没有choose的情况下使用:

idx = [np.arange(v[0], v[1]) for i,v in enumerate(startend)]
A[np.arange(A.shape[0])[:,None], idx]

idx与我的index_list类似,只是它没有添加行长。

np.array(idx)

array([[2, 3, 4],
       [3, 4, 5],
       [4, 5, 6],
       [5, 6, 7]])

由于每个arange具有相同的长度,因此可以在不迭代的情况下生成idx

col_start = np.array([2,3,4,5])
idx = col_start[:,None] + np.arange(3)

第一个索引是一个列数组,广播以匹配此idx

np.arange(A.shape[0])[:,None] 
array([[0],
       [1],
       [2],
       [3]])

使用此Aidx,我得到以下时间:

In [515]: timeit np.choose(idx,A.T[:,:,None])
10000 loops, best of 3: 30.8 µs per loop

In [516]: timeit A[np.arange(A.shape[0])[:,None],idx]
100000 loops, best of 3: 10.8 µs per loop

In [517]: timeit A.flat[idx+np.arange(A.shape[0])[:,None]*A.shape[1]]
10000 loops, best of 3: 24.9 µs per loop

flat索引更快,但计算发烧友指数需要一些时间。

对于大型数组,flat索引的速度占主导地位。

A=np.arange(4000).reshape(40,100)*.1
col_start=np.arange(20,60)
idx=col_start[:,None]+np.arange(30)

In [536]: timeit A[np.arange(A.shape[0])[:,None],idx]
10000 loops, best of 3: 108 µs per loop

In [537]: timeit A.flat[idx+np.arange(A.shape[0])[:,None]*A.shape[1]]
10000 loops, best of 3: 59.4 µs per loop

np.choose方法遇到硬编码限制:Need between 2 and (32) array objects (inclusive).


超出界限idx

col_start=np.array([2,4,6,8])
idx=col_start[:,None]+np.arange(3)
A[np.arange(A.shape[0])[:,None], idx]

产生错误,因为上一个idx值为10,太大了。

你可以clip idx

idx=idx.clip(0,A.shape[1]-1)

在最后一行产生重复值

[ 3.8,  3.9,  3.9]

您也可以在编制索引之前填充A。有关更多选项,请参阅np.pad

np.pad(A,((0,0),(0,2)),'edge')[np.arange(A.shape[0])[:,None], idx]

另一种选择是删除越界值。然后idx将成为列表(或列表数组)的参差不齐的列表。 flat方法可以处理这个问题,但结果不是矩阵。

startend = [[2,5],[4,7],[6,9],[8,10]]
index_list = [np.arange(v[0],v[1]) + i*A.shape[1] 
                 for i,v in enumerate(startend)]
# [array([2, 3, 4]), array([14, 15, 16]), array([26, 27, 28]), array([38, 39])]

A.flat[np.r_[tuple(index_list)]]
# array([ 0.2,  0.3,  0.4,  1.4,  1.5,  1.6,  2.6,  2.7,  2.8,  3.8,  3.9])

答案 1 :(得分:3)

您可以使用np.choose

以下是NumPy数组arr

的示例
array([[ 0,  1,  2,  3,  4,  5,  6],
       [ 7,  8,  9, 10, 11, 12, 13],
       [14, 15, 16, 17, 18, 19, 20]])

我们想要从第一行中选择值[1, 2, 3],从第二行选择[11, 12, 13],从第三行选择[17, 18, 19]

换句话说,我们会从arr的每一行中选出索引,如数组idx所示:

array([[1, 2, 3],
       [4, 5, 6],
       [3, 4, 5]])

然后使用np.choose

>>> np.choose(idx, arr.T[:,:,np.newaxis])
array([[ 1,  2,  3],
       [11, 12, 13],
       [17, 18, 19]])

要解释刚刚发生的事情:arr.T[:,:,np.newaxis]表示arr暂时被视为形状为(7, 3, 1)的3D数组。您可以将其想象为3D数组,其中原始arr的每列现在是具有三个值的2D列向量。 3D阵列看起来有点像这样:

#  0       1       2       3       4       5       6
[[ 0]   [[ 1]   [[ 2]   [[ 3]   [[ 4]   [[ 5]   [[ 6]   # choose values from 1, 2, 3
 [ 7]    [ 8]    [ 9]    [10]    [11]    [12]    [13]   # choose values from 4, 5, 6
 [14]]   [15]]   [16]]   [17]]   [18]]   [19]]   [20]]  # choose values from 3, 4, 5

要获取输出数组的第0行行,choose从索引1的2D列中选择第0个元素,<来自索引2的2D列的em>第0个元素,以及来自索引3的2D列的第0个元素。

要获取输出数组的第一行choose从索引4的2D列中选择第一个元素,<来自索引5的2D列的第一个元素,......等等。

答案 2 :(得分:1)

我认为您正在寻找类似下面的内容。当你访问它们时,我不确定你想用它们做什么。

indexes = [(4,6), (0,2), (2,4), (8, 10)]
arr = [
    [ . . . . | | | . . . . . ],
    [ | | | . . . . . . . . . ],
    [ . . | | | . . . . . . . ],
    [ . . . . . . . . | | | . ]
]

for x in zip(indexes, arr):
    index = x[0]
    row = x[1]
    print row[index[0]:index[1]+1]