与多列数据的欧氏距离

时间:2014-04-05 09:10:07

标签: python numpy scipy distance

我的数据如下:

data =

    2.29    2.048333333 2   2
    2.29    2.048333333 2   2
    2.29    2           2   2
    2.29    2.064444444 2   2

我想计算列之间的欧氏距离。结果是4X4矩阵,所有对角元素都是0,因为它们是相同的。

我怎样才能有效地做到这一点?

到现在为止,我只能找出2列之间的欧氏距离

我应该多次使用循环吗?

2 个答案:

答案 0 :(得分:1)

试试这个:

def main(data):
    total = []
    n = len(data)
    for i in range(n):
        tmp = []
        for j in range(n):
            a = data[i];
            b = data[j]
            tmp.append(dist(data[i],data[j]))
        total.append(tmp)
    return total

def dist(a,b):
    tmp = [pow(a - b,2) for a, b in zip(a, b)]
    return pow(sum(tmp),0.5);

def output(t):#this function is not necessary and is just for tidiness
    n = len(t)
    for i in range(n):
        for j in range(n):
            print t[i][j],"\t\t\t",
        print "\n"

data = [[1,1,1],[1,2,3],[0,0,0]]#just for test
t = main(data)
output(t)

答案 1 :(得分:1)

如果数据是numpy数组,则此代码可能更有效。

dist = np.empty_like(data)
for i, x in enumerate(data):
    dist[:, i] = np.sqrt(np.sum((data - x)**2, axis=1))