因此对于矩阵,我们有像numpy.flatten()
这样的方法np.array([[1,2,3],[4,5,6],[7,8,9]]).flatten()
给出[1,2,3,4,5,6,7,8,9]
如果我想从np.array([[1,2,3],[4,5,6],7])
到[1,2,3,4,5,6,7]
怎么办?
是否存在执行此类操作的现有功能?
答案 0 :(得分:5)
对于不均匀的列表,数组是一个对象dtype,(和1d,所以flatten不会改变它)
In [96]: arr=np.array([[1,2,3],[4,5,6],7])
In [97]: arr
Out[97]: array([[1, 2, 3], [4, 5, 6], 7], dtype=object)
In [98]: arr.sum()
...
TypeError: can only concatenate list (not "int") to list
7
元素给出了问题。如果我将其更改为列表:
In [99]: arr=np.array([[1,2,3],[4,5,6],[7]])
In [100]: arr.sum()
Out[100]: [1, 2, 3, 4, 5, 6, 7]
我在这里使用技巧。数组列表的元素和列表[1,2,3]+[4,5]
的元素是连接的。
基本点是对象数组不是二维数组。从许多方面来说,它更像是列表清单。
最佳列表展平者为chain
In [104]: list(itertools.chain(*arr))
Out[104]: [1, 2, 3, 4, 5, 6, 7]
虽然它也会阻塞整数7版本。
如果数组是列表列表(不是列表和标量的原始混合),则np.concatenate
有效。它迭代对象,就像它是一个列表一样。
使用混合原始列表concatenate
不起作用,但hstack
执行
In [178]: arr=np.array([[1,2,3],[4,5,6],7])
In [179]: np.concatenate(arr)
...
ValueError: all the input arrays must have same number of dimensions
In [180]: np.hstack(arr)
Out[180]: array([1, 2, 3, 4, 5, 6, 7])
那是因为hstack
首先遍历列表并确保所有元素都是atleast_1d
。这种额外的迭代使其更加稳健,但代价是处理速度。
In [170]: big1=arr.repeat(1000)
In [171]: timeit big1.sum()
10 loops, best of 3: 31.6 ms per loop
In [172]: timeit list(itertools.chain(*big1))
1000 loops, best of 3: 433 µs per loop
In [173]: timeit np.concatenate(big1)
100 loops, best of 3: 5.05 ms per loop
加倍大小
In [174]: big1=arr.repeat(2000)
In [175]: timeit big1.sum()
10 loops, best of 3: 128 ms per loop
In [176]: timeit list(itertools.chain(*big1))
1000 loops, best of 3: 803 µs per loop
In [177]: timeit np.concatenate(big1)
100 loops, best of 3: 9.93 ms per loop
In [182]: timeit np.hstack(big1) # the extra iteration hurts hstack speed
10 loops, best of 3: 43.1 ms per loop
sum
是二次大小
res=[]
for e in bigarr:
res += e
res
随着e的数量而增长,因此每个迭代步骤都更加昂贵。
chain
次最佳。
答案 1 :(得分:2)
您可以使用yield:
编写自定义展平函数def flatten(arr):
for i in arr:
try:
yield from flatten(i)
except TypeError:
yield i
用法示例:
>>> myarr = np.array([[1,2,3],[4,5,6],7])
>>> newarr = list(flatten(myarr))
>>> newarr
[1, 2, 3, 4, 5, 6, 7]
答案 2 :(得分:1)
您可以在此使用apply_along_axis
>>> arr = np.array([[1,2,3],[4,5,6],[7]])
>>> np.apply_along_axis(np.concatenate, 0, arr)
array([1, 2, 3, 4, 5, 6, 7])
作为奖励,这也不是列表数量的二次方。