numpy 2D矩阵 - 在这种情况下如何提高性能?

时间:2013-04-05 10:38:32

标签: python-2.7 numpy

我开始知道numpy对于一个非常大的矩阵的单个元素访问是缓慢的。代码的以下部分大约需要7-8分钟才能运行。矩阵的大小约为3000 * 3000

import numpy as np
................
................
ArrayLength=len(Coordinates)
AdjMatrix=np.zeros((len(Angles),len(Angles)))
for x in range(0, Arraylength):
    for y in range(x+1, Arraylength-x):
        distance=Distance(Coordinates[x],Coordinates[y)
            if(distance<=radius)
                AdjMatrix[x][y]=distance
                AdjMatrix[y][x]=distance

我基本上试图为包含大约3000个节点的图形构建邻接矩阵。有人可以帮助我做这种笨拙的方式吗?或任何其他选择?

编辑:这是Distance()函数

Def Distance(p1,p2):
    distance=np.sqrt(np.square(p1[0]-p2[0])+np.square(p1[1]-p2[1]))
    return distance

顺便说一句,我将坐标作为元组传递。如p [0] = x坐标和p [1] = y坐标。

1 个答案:

答案 0 :(得分:3)

您可以发布Distance()功能吗?如果它是常用函数,scipy.spatial.distance.cdist可以非常快速地计算距离矩阵:

http://docs.scipy.org/doc/scipy/reference/generated/scipy.spatial.distance.cdist.html#scipy.spatial.distance.cdist

修改

您确实可以使用pdist,这是一个示例:

from scipy.spatial.distance import pdist, squareform
coordinates = [(0.0, 0), (1.0, 2.0), (-1.0, 0.5), (3.1, 2.1)]
dist = squareform(pdist(coordinates))
print dist

输出:

[[ 0.          2.23606798  1.11803399  3.74432905]
 [ 2.23606798  0.          2.5         2.1023796 ]
 [ 1.11803399  2.5         0.          4.40113622]
 [ 3.74432905  2.1023796   4.40113622  0.        ]]

如果你想掩盖一些数据:

dist[dist > 3.0] = 0
print dist

输出:

[[ 0.          2.23606798  1.11803399  0.        ]
 [ 2.23606798  0.          2.5         2.1023796 ]
 [ 1.11803399  2.5         0.          0.        ]
 [ 0.          2.1023796   0.          0.        ]]