为什么使用数组作为索引会更改多维ndarray的形状?

时间:2019-04-24 12:03:30

标签: python numpy multidimensional-array numpy-ndarray numpy-slicing

我有一个4-D NumPy数组,轴说x,y,z,t。我想获取对应于t = 0的切片,并在y轴上排列顺序。

我有以下

import numpy as np
a = np.arange(120).reshape(4,5,3,2)
b = a[:,[1,2,3,4,0],:,0]
b.shape

我得到(5,4,3)而不是(4,5,3)。

相反,我输入

aa = a[:,:,:,0]
bb = aa[:,[1,2,3,4,0],:]
bb.shape

我得到了预期的(4,5,3)。有人可以解释为什么第一个版本交换前两个维吗?

1 个答案:

答案 0 :(得分:2)

正如@hpaulj在评论中提到的,此行为是因为混合了基本切片高级索引

a = np.arange(120).reshape(4,5,3,2)
b = a[:,[1,2,3,4,0],:,0]

在上面的代码片段中,发生了以下事情:

  • 当我们沿最后一个维度进行基本切片时,它会触发一个__getitem__调用。因此,该维度已消失。 (即没有单例尺寸)
  • [1,2,3,4,0]从第二维返回5个切片。有两种可能性将此形状放在返回的数组中:在第一个位置或最后一个位置。 NumPy决定将其放在第一个维度。这就是为什么在返回的形状元组的第一个位置上得到5(5, ...)的原因。如果我没记错的话,Jaime在一次PyCon谈话中对此进行了解释。

  • 沿着第一维和第三维,由于使用:切片所有内容,因此沿这些维的原始长度得以保留。

将所有这些放在一起,NumPy返回形状元组为:(5, 4, 3)

您可以在numpy-indexing-ambiguity-in-3d-arraysarrays.indexing#combining-advanced-and-basic-indexing

了解更多信息