import numpy as np
x = np.random.randn(2, 3, 4)
mask = np.array([1, 0, 1, 0], dtype=np.bool)
y = x[0, :, mask]
z = x[0, :, :][:, mask]
print(y)
print(z)
print(y.T)
为什么分两步完成上述操作会导致一步到位?
答案 0 :(得分:5)
这与列表索引的行为相同:
In [87]: x=np.arange(2*3*4).reshape(2,3,4)
In [88]: x[0,:,[0,2]]
Out[88]:
array([[ 0, 4, 8],
[ 2, 6, 10]])
In [89]: x[0,:,:][:,[0,2]]
Out[89]:
array([[ 0, 2],
[ 4, 6],
[ 8, 10]])
在第二种情况下,x[0,:,:]
返回一个(3,4)数组,下一个索引选择2列。
在第一种情况下,它首先选择第一个和最后一个尺寸,然后附加切片(中间尺寸)。 0
和[0,2]
生成2
维度,并附加中间的3
,形成(2,3)
形状。
这是混合基本和高级索引的一种情况。
http://docs.scipy.org/doc/numpy/reference/arrays.indexing.html#combining-advanced-and-basic-indexing
在第一种情况下,高级索引操作产生的维度首先出现在结果数组中,然后是子空间维度。
这不是一个容易理解或解释的案例。基本上对最终维度应该是什么有一些模糊性。它试图用示例x[:,ind_1,:,ind_2]
进行说明,其中ind_1
和ind_2
是3d(或者一起广播到那里)。
之前的解释是:
How does numpy order array slice indices?
Combining slicing and broadcasted indexing for multi-dimensional numpy arrays
===========================
解决这个问题的方法是用数组替换切片 - 列向量
In [221]: x[0,np.array([0,1,2])[:,None],[0,2]]
Out[221]:
array([[ 0, 2],
[ 4, 6],
[ 8, 10]])
In [222]: np.ix_([0],[0,1,2],[0,2])
Out[222]:
(array([[[0]]]), array([[[0],
[1],
[2]]]), array([[[0, 2]]]))
In [223]: x[np.ix_([0],[0,1,2],[0,2])]
Out[223]:
array([[[ 0, 2],
[ 4, 6],
[ 8, 10]]])
虽然这最后一个案例是3d,(1,3,2)。 ix_
不喜欢标量0.另一种使用ix_
的方式:
In [224]: i,j=np.ix_([0,1,2],[0,2])
In [225]: x[0,i,j]
Out[225]:
array([[ 0, 2],
[ 4, 6],
[ 8, 10]])
这是一种获得相同数字的方法,但是在(2,1,3)数组中:
In [232]: i,j=np.ix_([0,2],[0])
In [233]: x[j,:,i]
Out[233]:
array([[[ 0, 4, 8]],
[[ 2, 6, 10]]])