Question

我需要将一列数据添加到numpy rec数组中。我看到很多答案在这里浮动，但它们似乎不适用于只包含一行的rec数组......

我们说我有一个rec数组x：

>>> x = np.rec.array([1, 2, 3])
>>> print(x)
rec.array((1, 2, 3), 
      dtype=[('f0', '<i8'), ('f1', '<i8'), ('f2', '<i8')])

我希望将值4附加到具有自己的字段名称和数据类型的新列，例如

 rec.array((1, 2, 3, 4), 
      dtype=[('f0', '<i8'), ('f1', '<i8'), ('f2', '<i8'), ('f3', '<i8')])

如果我尝试使用普通append_fields方法添加列;

>>> np.lib.recfunctions.append_fields(x, 'f3', 4, dtypes='<i8', 
usemask=False, asrecarray=True)

然后我最终以

结束

TypeError: len() of unsized object

事实证明，对于只有一行的rec数组，len(x)不起作用，而x.size则不起作用。如果我改为使用np.hstack()，我会获得TypeError: invalid type promotion，如果我尝试np.c_，我会得到一个不受欢迎的结果

>>> np.c_[x, 4]
array([[(1, 2, 3), (4, 4, 4)]], 
  dtype=(numpy.record, [('f0', '<i8'), ('f1', '<i8'), ('f2', '<i8')]))

Answer 1

创建初始数组，使其具有形状（1，）;注意额外的括号：

envsubst

（如果In [17]: x = np.rec.array([[1, 2, 3]])是您无法控制的输入，则可以在x中使用之前使用x = np.atleast_1d(x)。）

然后确保append_fields()中给出的值也是长度为1的序列：

append_fields

Answer 2

这是一种在没有重复功能的情况下完成工作的方法：

In [64]: x = np.rec.array((1, 2, 3))
In [65]: y=np.zeros(x.shape, dtype=x.dtype.descr+[('f3','<i4')])
In [66]: y
Out[66]: 
array((0, 0, 0, 0), 
      dtype=[('f0', '<i4'), ('f1', '<i4'), ('f2', '<i4'), ('f3', '<i4')])
In [67]: for name in x.dtype.names: y[name] = x[name]
In [68]: y['f3']=4
In [69]: y
Out[69]: 
array((1, 2, 3, 4), 
      dtype=[('f0', '<i4'), ('f1', '<i4'), ('f2', '<i4'), ('f3', '<i4')])

从我在recfunctions代码中看到的情况来看，我认为它同样快。当然对于单排速度不是问题。通常，这些函数使用目标dtype创建一个新的“空白”数组，并根据名称（可能是递归地）从源到目标复制字段。通常，数组比字段具有更多的记录，因此相对来说，字段上的迭代不会很慢。

将数据列添加到只有一行的numpy rec数组中

2 个答案: