我在python(numpy数组或scipy.sparse.matrices)中有以下代码,它可以工作:
X[a,:][:,b]
但它看起来并不优雅。 'a'和'b'是1-D布尔掩码。
'a'与X.shape [0]具有相同的长度,'b'与X.shape [1]具有相同的长度
我尝试了X[a,b]
,但它不起作用。
我想要完成的是同时选择特定的行和列。例如,选择第0,7,8行,然后从该结果中选择第2,3,4列中的所有行
你如何让这更短,更优雅?
答案 0 :(得分:5)
你可以np.ix_
使用{{3}}这样的broadcasted indexing
,就像这样 -
X[np.ix_(a,b)]
虽然这不会比原始代码短,但希望应该更快。这是因为我们正在避免中间输出,就像使用一个切片创建X[a,:]
的原始代码一样,然后是另一个切片X[a,:][:,b]
来为我们提供最终输出。
此外,此方法适用于a
和b
作为int
和boolean
数组。
示例运行
In [141]: X = np.random.randint(0,99,(6,5))
In [142]: m,n = X.shape
In [143]: a = np.in1d(np.arange(m),np.random.randint(0,m,(m)))
In [144]: b = np.in1d(np.arange(n),np.random.randint(0,n,(n)))
In [145]: X[a,:][:,b]
Out[145]:
array([[17, 81, 64],
[87, 16, 54],
[98, 22, 11],
[26, 54, 64]])
In [146]: X[np.ix_(a,b)]
Out[146]:
array([[17, 81, 64],
[87, 16, 54],
[98, 22, 11],
[26, 54, 64]])
运行时测试
In [147]: X = np.random.randint(0,99,(600,500))
In [148]: m,n = X.shape
In [149]: a = np.in1d(np.arange(m),np.random.randint(0,m,(m)))
In [150]: b = np.in1d(np.arange(n),np.random.randint(0,n,(n)))
In [151]: %timeit X[a,:][:,b]
1000 loops, best of 3: 1.74 ms per loop
In [152]: %timeit X[np.ix_(a,b)]
1000 loops, best of 3: 1.24 ms per loop