如何在numpy中将ndarray的dtype更改为自定义的?

时间:2011-10-04 07:35:03

标签: python numpy recarray

我做了一个dtype:

mytype = np.dtype([('a',np.uint8), ('b',np.uint8), ('c',np.uint8)])

所以使用这个dtype的数组:

test1 = np.zeros(3, dtype=mytype)

test1是:

array([(0, 0, 0), (0, 0, 0), (0, 0, 0)],
      dtype=[('a', '|u1'), ('b', '|u1'), ('c', '|u1')])

现在我有test2:

test2 = np.array([[1,2,3], [4,5,6], [7,8,9]])

当我使用test2.astype(mytype)时,结果不是我想要的结果:

array([[(1, 1, 1), (2, 2, 2), (3, 3, 3)],
       [(4, 4, 4), (5, 5, 5), (6, 6, 6)],
       [(7, 7, 7), (8, 8, 8), (9, 9, 9)]],
      dtype=[('a', '|u1'), ('b', '|u1'), ('c', '|u1')])

我希望结果是:

array([(1, 2, 3), (4, 5, 6), (7, 8, 9)],
      dtype=[('a', '|u1'), ('b', '|u1'), ('c', '|u1')])

有什么办法吗?感谢。

3 个答案:

答案 0 :(得分:5)

您可以使用numpy.core.records的fromarrays方法(请参阅documentation):

np.rec.fromarrays(test2.T, mytype)
Out[13]: 
rec.array([(1, 2, 3), (4, 5, 6), (7, 8, 9)], 
      dtype=[('a', '|u1'), ('b', '|u1'), ('c', '|u1')])

必须首先转置数组,因为函数将数组的行视为输出中结构化数组的列。另请参阅此问题:Converting a 2D numpy array to a structured array

答案 1 :(得分:0)

因为所有字段都是同一类型,所以您也可以使用:

>>> test2.astype(np.uint8).view(mytype).squeeze(axis=-1)
array([(1, 2, 3), (4, 5, 6), (7, 8, 9)], 
      dtype=[('a', 'u1'), ('b', 'u1'), ('c', 'u1')])

需要挤压,因为test2是2d,但你想要1d结果

答案 2 :(得分:0)

在创建数组时,如果可迭代的输入包含元组(保证不可变)而不是列表(保证不可变),那么只要数字,它将自动按照您想要的方式接受输入每个元组中的项目数等于结构中的字段数:

In[7]: test2 = np.array([(1,2,3), (4,5,6), (7,8,9)], dtype = mytype)

In[8]: test2
Out[8]: 
array([(1, 2, 3), (4, 5, 6), (7, 8, 9)],
      dtype=[('a', 'u1'), ('b', 'u1'), ('c', 'u1')])

仅此一项就无需去np.rec等。但是,如果可迭代的输入包含列表而不是元组,则 numpy 不会像您期望的那样将字段一一对应,而是进行数据重复。