如何将新行添加到空的numpy数组中

时间:2014-03-13 22:39:27

标签: python numpy scipy

使用标准Python数组,我可以执行以下操作:

arr = []
arr.append([1,2,3])
arr.append([4,5,6])
# arr is now [[1,2,3],[4,5,6]]

然而,我不能在numpy做同样的事情。例如:

arr = np.array([])
arr = np.append(arr, np.array([1,2,3]))
arr = np.append(arr, np.array([4,5,6]))
# arr is now [1,2,3,4,5,6]

我也调查了vstack,但当我在空数组上使用vstack时,我得到:

ValueError: all the input array dimensions except for the concatenation axis must match exactly

那么如何在numpy中为空数组追加一个新行呢?

6 个答案:

答案 0 :(得分:153)

“启动”所需数组的方法是:

arr = np.empty((0,3), int)

这是一个空数组,但它具有适当的维度。

>>> arr
array([], shape=(0, 3), dtype=int64)

然后一定要沿轴0追加:

arr = np.append(arr, np.array([[1,2,3]]), axis=0)
arr = np.append(arr, np.array([[4,5,6]]), axis=0)

但是,@ jonrsharpe是对的。实际上,如果你要在循环中追加,那么在第一个例子中追加到列表会快得多,然后在最后转换为numpy数组,因为你真的没有使用numpy作为在循环中打算:

In [210]: %%timeit
   .....: l = []
   .....: for i in xrange(1000):
   .....:     l.append([3*i+1,3*i+2,3*i+3])
   .....: l = np.asarray(l)
   .....: 
1000 loops, best of 3: 1.18 ms per loop

In [211]: %%timeit
   .....: a = np.empty((0,3), int)
   .....: for i in xrange(1000):
   .....:     a = np.append(a, 3*i+np.array([[1,2,3]]), 0)
   .....: 
100 loops, best of 3: 18.5 ms per loop

In [214]: np.allclose(a, l)
Out[214]: True

这种方法取决于你的申请,但它更像是:

In [220]: timeit n = np.arange(1,3001).reshape(1000,3)
100000 loops, best of 3: 5.93 µs per loop

In [221]: np.allclose(a, n)
Out[221]: True

答案 1 :(得分:22)

在这种情况下,您可能希望使用函数np.hstack和np.vstack

arr = np.array([])
arr = np.hstack((arr, np.array([1,2,3])))
# arr is now [1,2,3]

arr = np.vstack((arr, np.array([4,5,6])))
# arr is now [[1,2,3],[4,5,6]]

您也可以使用np.concatenate函数。

干杯

答案 2 :(得分:1)

使用自定义dtype定义,对我有用的是:

import numpy

# define custom dtype
type1 = numpy.dtype([('freq', numpy.float64, 1), ('amplitude', numpy.float64, 1)])
# declare empty array, zero rows but one column
arr = numpy.empty([0,1],dtype=type1)
# store row data, maybe inside a loop
row = numpy.array([(0.0001, 0.002)], dtype=type1)
# append row to the main array
arr = numpy.row_stack((arr, row))
# print values stored in the row 0
print float(arr[0]['freq'])
print float(arr[0]['amplitude'])

答案 3 :(得分:1)

如果要为循环数组添加新行,请直接为首次循环分配数组,而不是初始化一个空数组。

for i in range(0,len(0,100)):
    SOMECALCULATEDARRAY = .......
    if(i==0):
        finalArrayCollection = SOMECALCULATEDARRAY
    else:
        finalArrayCollection = np.vstack(finalArrayCollection,SOMECALCULATEDARRAY)

这主要在数组形状未知的情况下有用

答案 4 :(得分:0)

我想做一个for循环,但是用askewchan的方法效果不好,所以我修改了它。

x=np.empty((0,3))
y=np.array([1 2 3])
for i in ...
x = vstack((x,y))

答案 5 :(得分:0)

考虑到内存时,这是更有效的方法:

shape = (n, inp_len)
arr= np.empty(shape)

for i in range(n):
    arr[i] = np.expand_dims(arr, axis=0)