我正在尝试计算欧几里德距离的矢量化实现(使用内积在X和Y中的每个元素之间)。数据如下:
X = np.random.uniform(low=0, high=1, size=(10000, 5))
Y = np.random.uniform(low=0, high=1, size=(10000, 5))
我做的是:
euclidean_distances_vectorized = np.array(np.sqrt(np.sum(X**2, axis=1) - 2 * np.dot(X, Y.T) + np.sum(Y**2, axis=1)))
虽然这给出了“一些输出”但答案是错误的,因为每行仍然包含5个元素。
有谁知道我做错了什么?
答案 0 :(得分:3)
如果我理解正确,应该这样做
np.linalg.norm(X - Y, axis=1)
或einsum
(沿第一轴的每个差异对的点积的平方根)
np.sqrt(np.einsum('ij,ij->i...', X - Y, X - Y))
如果你想要所有成对距离
from scipy.spatial.distance import cdist
cdist(X, Y)