高级切片。高阶切片/选择

时间:2019-02-12 15:52:44

标签: python numpy

我对今天在我们的代码库中找到的某些代码中的numpy高级切片的语义感到困惑。让我从一个示例开始:

# example boolean matrix
a = np.random.rand(5, 5) > 0.5

# Outputs
array([[ True, False,  True,  True, False],
       [ True,  True, False,  True, False],
       [False,  True,  True,  True,  True],
       [False, False, False, False,  True],
       [False,  True,  True, False, False]])
dim_1 = np.arange(5)
dim_1 = dim_1[:, None] # expand into ndarray :: (5,1)
dim_2 = np.eye(5,5).astype(int) # convert to ints so we can use as idx
a[dim_1, dim_2]

# Outputs
array([[False,  True,  True,  True,  True],
       [ True,  True,  True,  True,  True],
       [False, False,  True, False, False],
       [False, False, False, False, False],
       [False, False, False, False,  True]])

我们在这里观察到的是dim_2正在选择a的值。在此示例中,我们沿眼睛看到a [:,1],而其余条目则为a [:,0]。  虽然我确实理解了输出,但是我并不理解语义。真正让我感到困惑的是,首先将其重塑成(5,1)。没有额外的维度,结果是完全不同的。我对高级切片的理解是,您可以使用高阶ndarray索引到其他ndarray的索引,但只能从最后一个维度中进行选择。要实现更高阶的切片,您需要分别索引每个维度,这将返回一个平面向量。

我认为该方法非常简洁,但是我缺乏对numpy如何解析此切片的理解。任何人都有见识?

1 个答案:

答案 0 :(得分:2)

制作一个独特的数组:

In [13]: a = np.arange(25).reshape(5,5)

In [14]: dim1 = np.arange(5)[:,None]
In [15]: dim2 = np.eye(5,5).astype(int)

看看这两个阵列如何相互广播:

In [16]: np.broadcast_arrays(dim1, dim2)
Out[16]: 
[array([[0, 0, 0, 0, 0],
        [1, 1, 1, 1, 1],
        [2, 2, 2, 2, 2],
        [3, 3, 3, 3, 3],
        [4, 4, 4, 4, 4]]), 
 array([[1, 0, 0, 0, 0],
        [0, 1, 0, 0, 0],
        [0, 0, 1, 0, 0],
        [0, 0, 0, 1, 0],
        [0, 0, 0, 0, 1]])]

返回的数组将这2个形状匹配,并通过配对每个元素中的a来选择元素。

In [17]: a[dim1, dim2]
Out[17]: 
array([[ 1,  0,  0,  0,  0],
       [ 5,  6,  5,  5,  5],
       [10, 10, 11, 10, 10],
       [15, 15, 15, 16, 15],
       [20, 20, 20, 20, 21]])

对于每行,由dim1索引,它根据dim2的值从第0列或第1列中选择一个元素:

In [21]: a[0, dim2[0,:]]
Out[21]: array([1, 0, 0, 0, 0])
In [22]: a[3, dim2[3,:]]
Out[22]: array([15, 15, 15, 16, 15])

如果我将dim2更改为“对角线”

In [25]: dim2 = np.diag(np.arange(5))
In [26]: dim2
Out[26]: 
array([[0, 0, 0, 0, 0],
       [0, 1, 0, 0, 0],
       [0, 0, 2, 0, 0],
       [0, 0, 0, 3, 0],
       [0, 0, 0, 0, 4]])
In [27]: a[dim1, dim2]
Out[27]: 
array([[ 0,  0,  0,  0,  0],
       [ 5,  6,  5,  5,  5],
       [10, 10, 12, 10, 10],
       [15, 15, 15, 18, 15],
       [20, 20, 20, 20, 24]])

现在大多数值是a[:,0],但是对角线是a[i,i]

此索引与1d数组的索引没有什么不同,

In [28]: a[np.arange(5), np.arange(5)]
Out[28]: array([ 0,  6, 12, 18, 24])

a[0,0], a[1,1], a[2,2], ...

另一个示例,可以通过相互广播两个数组来解释。这将选择所有与a[:,:]相同的元素,只是它是一个副本而不是一个视图:

In [29]: a[np.arange(5)[:,None], np.arange(5)[None,:]]
Out[29]: 
array([[ 0,  1,  2,  3,  4],
       [ 5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14],
       [15, 16, 17, 18, 19],
       [20, 21, 22, 23, 24]])