将记录添加到numpy记录数组中

时间:2013-04-26 23:31:13

标签: python numpy concatenation record

假设我定义了一个记录数组

>>> y=np.zeros(4,dtype=('a4,int32,float64'))

然后我继续填写可用的4条记录。现在我获得了更多数据,比如

>>> c=('a',7,'24.5')

我希望将此记录添加到y。我无法想出一个干净的方法来做到这一点。我在np.concatenate()中看到的最好的,但这需要将c转换为记录数组本身。有没有简单的方法可以将我的元组c添加到y上?这似乎应该是非常简单和广泛记录的。如果是的话道歉。我找不到它。

2 个答案:

答案 0 :(得分:22)

您可以使用numpy.append(),但是您还需要将新数据转换为记录数组:

import numpy as np
y = np.zeros(4,dtype=('a4,int32,float64'))
y = np.append(y, np.array([("0",7,24.5)], dtype=y.dtype))

由于ndarray无法动态更改其大小,因此您需要在要添加一些新数据时复制所有数据。您可以创建一个减少调整大小频率的类:

import numpy as np

class DynamicRecArray(object):
    def __init__(self, dtype):
        self.dtype = np.dtype(dtype)
        self.length = 0
        self.size = 10
        self._data = np.empty(self.size, dtype=self.dtype)

    def __len__(self):
        return self.length

    def append(self, rec):
        if self.length == self.size:
            self.size = int(1.5*self.size)
            self._data = np.resize(self._data, self.size)
        self._data[self.length] = rec
        self.length += 1

    def extend(self, recs):
        for rec in recs:
            self.append(rec)

    @property
    def data(self):
        return self._data[:self.length]

y = DynamicRecArray(('a4,int32,float64'))
y.extend([("xyz", 12, 3.2), ("abc", 100, 0.2)])
y.append(("123", 1000, 0))
print y.data
for i in xrange(100):
    y.append((str(i), i, i+0.1))

答案 1 :(得分:5)

这是因为通常会避免连接numpy数组,因为它需要重新分配连续的内存空间。调整数组大小,留出余地,然后根据需要连接大块。 This post可能会有所帮助。