我想计算 2D 数据集 (xCoords , yCoords) 中的平均欧几里得距离,但仅计算相邻点之间的距离。
举个例子:
>>> ser.sort_index(ascending=True)
Category
0 28793.78
Amazon 6380.09
Boots 239.62
Newspapers 279.76
Supermarker 5895.26
Taxi 324.79
dtype: float64
我想找到点之间的欧几里得距离,但只找到彼此相邻的点。我的任务可能有 numpy、scipy 或 sklearn 函数(或其他一些函数)吗?
编辑:
举个例子:
我想要的:
我不想要的:
我不想计算从每个数据点到所有其他数据点的欧几里德距离。
答案 0 :(得分:2)
Sklearn 有 eucliedean_distances 函数:https://scikit-learn.org/stable/modules/generated/sklearn.metrics.pairwise.euclidean_distances.html
>>> from sklearn.metrics.pairwise import euclidean_distances
>>> X = [[0, 1], [1, 1]]
>>> # distance between rows of X
>>> euclidean_distances(X, X)
array([[0., 1.],
[1., 0.]])
>>> # get distance to origin
>>> euclidean_distances(X, [[0, 0]])
array([[1. ],
[1.41421356]])
该函数返回一个矩阵,其中包含每对坐标之间的欧几里得距离,如果这不是您所需要的,您可以使用您想要获得这些“相邻距离”的规则来过滤该矩阵。
或者您可能需要某种聚类算法(如 k-means),它将划分聚类中最近的点,然后获得每个聚类的平均距离。