Numpy错误:形状不匹配

时间:2014-05-16 01:58:46

标签: python arrays numpy

当我试图用Python(Numpy)解决一个科学问题时,一个“形状不匹配”#39;错误出现了:"形状不匹配:对象无法广播到单个形状"。我设法以更简单的形式重现相同的错误,如下所示:

import numpy as np
nx = 3; ny = 5
ff = np.ones([nx,ny,7])
def test(x, y):
    z = 0.0
    for i in range(7):
        z = z + ff[x,y,i]
    return z

print test(np.arange(nx),np.arange(ny))

当我尝试使用test(x,y)拨打x=1,y=np.arange(ny)时,一切正常。那么这里发生了什么?为什么这两个参数都不能成为numpy数组?

更新

我用@Saullo Castro的一些提示解决了这个问题。这里有一些更新的信息给那些试图提供帮助但却不清楚我的意图的人:

基本上我创建了一个维度为nx * ny的网格网格和另一个为每个节点存储一些值的数组ff。在上面的代码中,ff每个节点有7个值,我试图总结7个值以获得新的nx * ny数组。

然而,"形状不匹配"错误不是由于求和过程,因为许多人现在可能已经猜到了。我误解了将ndarray对象作为输入参数的函数规则。我试图将np.arange(nx), np.arange(ny)传递给test()即使nx==ny也不会给我我想要的东西。

回到我的初衷,我通过创建另一个函数并使用np.fromfunction来创建数组来解决问题:

def tt(x, y):  
    return np.fromfunction(lambda a,b: test(a,b), (x, y))

这不完美但它有效。 (在这个例子中,似乎没有必要创建一个新函数,但在我的实际代码中我修改了一下,因此它可以用于网格的切片)

无论如何,我相信与我的肮脏解决方案相比,这是一个更好的方法。因此,如果您对此有任何疑问,请与我们分享:)。

4 个答案:

答案 0 :(得分:2)

让我们看一下类似于ff数组的数组:

nx = 3; ny = 4
ff = np.arange(nx*ny*5).reshape(nx,ny,5)
#array([[[ 0,  1,  2,  3,  4],
#        [ 5,  6,  7,  8,  9],
#        [10, 11, 12, 13, 14],
#        [15, 16, 17, 18, 19]],
#
#       [[20, 21, 22, 23, 24],
#        [25, 26, 27, 28, 29],
#        [30, 31, 32, 33, 34],
#        [35, 36, 37, 38, 39]],
#
#       [[40, 41, 42, 43, 44],
#        [45, 46, 47, 48, 49],
#        [50, 51, 52, 53, 54],
#        [55, 56, 57, 58, 59]]])

使用a, b, c中的索引数组ff[a, b, c]进行索引时,a, b, c必须具有相同的形状,numpy将根据索引构建新数组。例如:

ff[[0, 0, 1, 1, 2, 2], [0, 1, 0, 1, 2, 3], [0, 0, 0, 1, 1, 1]]
#array([ 0,  5, 20, 26, 51, 56])

这称为花式索引,就像使用:

构建数组一样
np.array([ff[0, 0, 0], ff[0, 1, 0], ff[1, 0, 0], ..., ff[2, 3, 1]])

在您的情况下,f[x, y, i]会产生形状不匹配错误,因为a, b, c的形状不同。

答案 1 :(得分:1)

您希望在最后一个维度上对ff求和,其中前两个维度涵盖整个范围。 :用于表示维度的整个范围:

def test():
    z = 0.0
    for i in range(7):
        z = z + ff[:,:,i]
    return z
print test()

但是,通过使用sum方法,您可以在不循环的情况下获得相同的结果。

print ff.sum(axis=-1)

:0:n

的简写
ff[0:nx, 0:ny, 0]==ff[:,:,0]

可以使用范围索引ff的块,但是您必须更加小心索引数组的形状。对于初学者,最好将重点放在让slicingbroadcasting更正。


编辑 -

您可以使用ff生成的数组索引像meshgrid这样的数组:

I,J = meshgrid(np.arange(nx),np.arange(ny),indexing='ij',sparse=False)
I.shape # (nx,ny)
ff[I,J,:]

也适用于

I,J = meshgrid(np.arange(nx),np.arange(ny),indexing='ij',sparse=True)
I.shape # (nx,1)
J.shape # (1, ny)

ogridmgridmeshgrid的替代品。

答案 2 :(得分:0)

让我们在2D情况下重现您的问题,因此更容易看到:

import numpy as np

a = np.arange(15).reshape(3,5)

x = np.arange(3)
y = np.arange(5)

演示:

>>> a
array([[ 0,  1,  2,  3,  4],
       [ 5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14]])
>>> a[x, y] # <- This is the error that you are getting
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
ValueError: shape mismatch: objects cannot be broadcast to a single shape

# You are getting the error because x and y are different lengths,
# If x and y were the same lengths, the code would work: 

>>> a[x, x]
array([ 0,  6, 12])

# mixing arrays and scalars is not a problem

>>> a[x, 2]
array([ 2,  7, 12])

答案 3 :(得分:0)

您的问题不清楚您要做什么或您期望得到什么结果。但是,您似乎正在尝试使用变量z计算总计。

检查sum方法是否产生您需要的结果:

import numpy as np
nx = 3; ny = 5

ff = ff = np.array(np.arange(nx*ny*7)).reshape(nx,ny,7)

print ff.sum()          # 5460

print ff.sum(axis=0)    # array([[105, 108, 111, 114, 117, 120, 123],
                        #        [126, 129, 132, 135, 138, 141, 144],
                        #        [147, 150, 153, 156, 159, 162, 165],
                        #        [168, 171, 174, 177, 180, 183, 186],
                        #        [189, 192, 195, 198, 201, 204, 207]]) shape(5,7)

print ff.sum(axis=1)    # array([[ 70,  75,  80,  85,  90,  95, 100],
                        #        [245, 250, 255, 260, 265, 270, 275],
                        #        [420, 425, 430, 435, 440, 445, 450]]) shape (3,7)

print ff.sum(axis=2)    # array([[ 21,  70, 119, 168, 217],
                        #        [266, 315, 364, 413, 462],
                        #        [511, 560, 609, 658, 707]]) shape (3,5)