我试图将2D ndarray视图作为记录或结构化数组而不进行复制。如果a
拥有数据
>>> a = np.array([[ 1, 391, 14, 26],
[ 17, 371, 15, 30],
[641, 340, 4, 7]])
>>> b = a.view(zip('abcd',[a.dtype]*4))
array([[(1, 391, 14, 26)],
[(17, 371, 15, 30)],
[(641, 340, 4, 7)]],
dtype=[('a', '<i8'), ('b', '<i8'), ('c', '<i8'), ('d', '<i8')])
>>> b.base is a
True
但如果a
已经是视图,则会失败。这是一个例子
>>> b = a[:,[0,2,1,3]]
>>> b.base is None
False
>>> b.view(zip('abcd',[a.dtype]*4))
ValueError: new type not compatible with array.
有趣的是,在这种情况下,b.base
是视图的转置
>>> (b.base == b.T).all()
True
因此,numpy无法创建我想要的视图。
但是,如果我使用
>>> b = np.take(a,[0,2,1,3],axis=1)
这导致b
成为数据的正确副本,以便使重新排列视图有效。附带问题:有人可以解释这种行为与花哨的索引相对应吗?
我的问题是,我是否采取了错误的方式?是否按照我不支持的方式进行观察?如果是这样,那么这样做的正确方法是什么?
答案 0 :(得分:1)
(大编辑)
b
为F_CONTINGUOUS
(请参阅b.flags
)。然后,视图中的字段数需要与b
的行数匹配,而不是列数:
In [204]: b=a[:,[0,2,1,3]].view('i4,i4,i4')
In [205]: b
Out[205]:
array([[(0, 4, 8), (2, 6, 10), (1, 5, 9), (3, 7, 11)]],
dtype=[('f0', '<i4'), ('f1', '<i4'), ('f2', '<i4')])
更简单的情况是a.copy(order='F').view('i4,i4,i4')
np.take(a,[0,2,1,3],axis=1)
和a[:,[0,2,1,3]].copy()
生成C_CONTIGUOUS
份副本,因此可以使用4个字段进行查看。
另请注意,b.base
有3列。
(早先在这个问题上磕磕绊绊)
成为一个观点不是问题。
a = np.arange(12).reshape(3,4)
a.view('i4,i4,i4,i4')
没关系。
制作第一个b
的副本也有效:
b=a[:,[0,2,1,3]].copy()
b.view('i4,i4,i4,i4')
第一个b
(没有副本)是F_CONTIGUOUS
(请查看b.flags
)。这就是您的b.base == b.T
所显示的内容。
np.take
生成与b
copy
相同的数组 - 即显示相同的标记和相同的__array_interface__
。
其他有效的方法:
a[[0,2,1],:].view('i4,i4,i4,i4')
a.T[[0,2,1,3],:].T.view('i4,i4,i4,i4')
如果我用纯数组索引替换混合切片和数组索引:
a[[[0],[1],[2]],[0,2,1,3]].view('i4,i4,i4,i4')
结果是C_CONTIGUOUS
。因此[:, [...]]
中有一些我没有解释的细节 - 特别是它为什么会生成F_CONTIGUOUS
副本。
混合的基本/高级索引doc部分确实警告内存布局可以更改:
http://docs.scipy.org/doc/numpy/reference/arrays.indexing.html#combining-advanced-and-basic-indexing
在最简单的情况下,只有一个高级索引。单个高级索引可以例如替换切片,并且结果数组将是相同的,但是,它是副本并且可以具有不同的存储器布局。如果可能,最好使用切片。