获取ndarray的重新查看视图(也可能是视图)

时间:2015-08-22 19:41:54

标签: python numpy recarray structured-array

我试图将2D ndarray视图作为记录或结构化数组而不进行复制。如果a拥有数据

,这似乎工作正常
>>> a = np.array([[  1, 391,  14,  26],
              [ 17, 371,  15,  30],
              [641, 340,   4,   7]])
>>> b = a.view(zip('abcd',[a.dtype]*4))
array([[(1, 391, 14, 26)],
       [(17, 371, 15, 30)],
       [(641, 340, 4, 7)]], 
      dtype=[('a', '<i8'), ('b', '<i8'), ('c', '<i8'), ('d', '<i8')])
>>> b.base is a
True

但如果a已经是视图,则会失败。这是一个例子

>>> b = a[:,[0,2,1,3]]
>>> b.base is None
False
>>> b.view(zip('abcd',[a.dtype]*4))
ValueError: new type not compatible with array.

有趣的是,在这种情况下,b.base是视图的转置

>>> (b.base == b.T).all()
True

因此,numpy无法创建我想要的视图。

但是,如果我使用

>>> b = np.take(a,[0,2,1,3],axis=1)

这导致b成为数据的正确副本,以便使重新排列视图有效。附带问题:有人可以解释这种行为与花哨的索引相对应吗?

我的问题是,我是否采取了错误的方式?是否按照我不支持的方式进行观察?如果是这样,那么这样做的正确方法是什么?

1 个答案:

答案 0 :(得分:1)

(大编辑)

bF_CONTINGUOUS(请参阅b.flags)。然后,视图中的字段数需要与b的行数匹配,而不是列数:

In [204]: b=a[:,[0,2,1,3]].view('i4,i4,i4')
In [205]: b
Out[205]: 
array([[(0, 4, 8), (2, 6, 10), (1, 5, 9), (3, 7, 11)]], 
      dtype=[('f0', '<i4'), ('f1', '<i4'), ('f2', '<i4')])

更简单的情况是a.copy(order='F').view('i4,i4,i4')

np.take(a,[0,2,1,3],axis=1)a[:,[0,2,1,3]].copy()生成C_CONTIGUOUS份副本,因此可以使用4个字段进行查看。

另请注意,b.base有3列。

(早先在这个问题上磕磕绊绊)

成为一个观点不是问题。

 a = np.arange(12).reshape(3,4)
 a.view('i4,i4,i4,i4')

没关系。

制作第一个b的副本也有效:

 b=a[:,[0,2,1,3]].copy()
 b.view('i4,i4,i4,i4')

第一个b(没有副本)是F_CONTIGUOUS(请查看b.flags)。这就是您的b.base == b.T所显示的内容。

np.take生成与b copy相同的数组 - 即显示相同的标记和相同的__array_interface__

其他有效的方法:

a[[0,2,1],:].view('i4,i4,i4,i4')
a.T[[0,2,1,3],:].T.view('i4,i4,i4,i4')

如果我用纯数组索引替换混合切片和数组索引:

a[[[0],[1],[2]],[0,2,1,3]].view('i4,i4,i4,i4')

结果是C_CONTIGUOUS。因此[:, [...]]中有一些我没有解释的细节 - 特别是它为什么会生成F_CONTIGUOUS副本。

混合的基本/高级索引doc部分确实警告内存布局可以更改:

http://docs.scipy.org/doc/numpy/reference/arrays.indexing.html#combining-advanced-and-basic-indexing

  

在最简单的情况下,只有一个高级索引。单个高级索引可以例如替换切片,并且结果数组将是相同的,但是,它是副本并且可以具有不同的存储器布局。如果可能,最好使用切片。