将结构化数组转换为常规NumPy数组

时间:2011-05-10 22:49:00

标签: python numpy recarray

我认为答案非常明显,但我现在还没有看到。

如何将记录数组转换回常规的ndarray?

假设我有以下简单的结构化数组:

x = np.array([(1.0, 4.0,), (2.0, -1.0)], dtype=[('f0', '<f8'), ('f1', '<f8')])

然后我想将其转换为:

array([[ 1.,  4.],
       [ 2., -1.]])

我尝试了asarrayastype,但这不起作用。

UPDATE(已解决:float32(f4)而不是float64(f8))

好的,我尝试过Robert(x.view(np.float64).reshape(x.shape + (-1,)) )的解决方案,并且使用简单的数组就可以完美地运行。但是对于我想要转换的数组,它会产生一个奇怪的结果:

data = np.array([ (0.014793682843446732, 0.006681123282760382, 0.0, 0.0, 0.0, 0.0008984912419691682, 0.0, 0.013475529849529266, 0.0, 0.0),
       (0.014793682843446732, 0.006681123282760382, 0.0, 0.0, 0.0, 0.0008984912419691682, 0.0, 0.013475529849529266, 0.0, 0.0),
       (0.014776384457945824, 0.006656022742390633, 0.0, 0.0, 0.0, 0.0008901208057068288, 0.0, 0.013350814580917358, 0.0, 0.0),
       (0.011928378604352474, 0.002819152781739831, 0.0, 0.0, 0.0, 0.0012627150863409042, 0.0, 0.018906937912106514, 0.0, 0.0),
       (0.011928378604352474, 0.002819152781739831, 0.0, 0.0, 0.0, 0.001259754877537489, 0.0, 0.01886274479329586, 0.0, 0.0),
       (0.011969991959631443, 0.0028706740122288465, 0.0, 0.0, 0.0, 0.0007433745195157826, 0.0, 0.011164642870426178, 0.0, 0.0)], 
      dtype=[('a_soil', '<f4'), ('b_soil', '<f4'), ('Ea_V', '<f4'), ('Kcc', '<f4'), ('Koc', '<f4'), ('Lmax', '<f4'), ('malfarquhar', '<f4'), ('MRN', '<f4'), ('TCc', '<f4'), ('Vcmax_3', '<f4')])

然后:

data_array = data.view(np.float).reshape(data.shape + (-1,))

给出:

In [8]: data_array
Out[8]: 
array([[  2.28080997e-20,   0.00000000e+00,   2.78023241e-27,
          6.24133580e-18,   0.00000000e+00],
       [  2.28080997e-20,   0.00000000e+00,   2.78023241e-27,
          6.24133580e-18,   0.00000000e+00],
       [  2.21114197e-20,   0.00000000e+00,   2.55866881e-27,
          5.79825816e-18,   0.00000000e+00],
       [  2.04776835e-23,   0.00000000e+00,   3.47457730e-26,
          9.32782857e-17,   0.00000000e+00],
       [  2.04776835e-23,   0.00000000e+00,   3.41189244e-26,
          9.20222417e-17,   0.00000000e+00],
       [  2.32706550e-23,   0.00000000e+00,   4.76375305e-28,
          1.24257748e-18,   0.00000000e+00]])

这是一个包含其他数字和另一种形状的数组。我做错了什么?

5 个答案:

答案 0 :(得分:34)

最简单的方法可能是

x.view((float, len(x.dtype.names)))

float通常必须替换为xx.dtype[0])中元素的类型。这假设所有元素都具有相同的类型。

此方法只需一步即可为您提供常规numpy.ndarray版本(而不是view(…).reshape(…)方法所需的两个步骤。

答案 1 :(得分:22)

[~]
|5> x = np.array([(1.0, 4.0,), (2.0, -1.0)], dtype=[('f0', '<f8'), ('f1', '<f8')])

[~]
|6> x.view(np.float64).reshape(x.shape + (-1,))
array([[ 1.,  4.],
       [ 2., -1.]])

答案 2 :(得分:7)

np.array(x.tolist())
array([[ 1.,  4.],
      [ 2., -1.]])

但也许有更好的方法......

答案 3 :(得分:1)

结合处理多字段索引的方式numpy提供了两个新功能,可以帮助在结构化数组之间进行转换:

numpy.lib.recfunctions中,它们是structured_to_unstructuredunstructured_to_structuredrepack_fields是另一个新功能。

摘自1.16发行说明

  

多字段视图返回视图而不是副本

     

索引具有多个字段的结构化数组,例如arr [['f1','f3']],将返回原始数组的视图,而不是副本。返回的视图通常会具有与原始数组中的插入字段相对应的额外填充字节,这与以前不同,这会影响诸如arr [['f1','f3']]。view('float64')之类的代码。自numpy 1.7起已计划进行此更改。从那以后,沿这条道路前进的行动已经发出了FutureWarnings。在1.12中添加了有关此更改的其他FutureWarnings。

     

为帮助用户更新代码以应对这些更改,已将许多函数添加到numpy.lib.recfunctions模块中,这些函数可以安全地进行此类操作。例如,上面的代码可以替换为Structural_to_unstructured(arr [['f1','f3']],dtype ='float64')。请参阅用户指南的“访问多个字段”部分。

答案 4 :(得分:0)

使用root_numpy rec2array 函数的非常简单的解决方案:

np_array = rec2array(x)

root_numpy 实际上已被弃用,但 rec2array 代码仍然有用(源here):

def rec2array(rec, fields=None):

  simplify = False

  if fields is None:
      fields = rec.dtype.names
  elif isinstance(fields, string_types):
      fields = [fields]
      simplify = True

  # Creates a copy and casts all data to the same type
  arr = np.dstack([rec[field] for field in fields])

  # Check for array-type fields. If none, then remove outer dimension.
  # Only need to check first field since np.dstack will anyway raise an
  # exception if the shapes don't match
  # np.dstack will also fail if fields is an empty list
  if not rec.dtype[fields[0]].shape:
      arr = arr[0]

  if simplify:
      # remove last dimension (will be of size 1)
      arr = arr.reshape(arr.shape[:-1])

  return arr