Jaccard距离的轮廓分数

时间:2020-03-15 12:30:18

标签: python binary-data euclidean-distance

我正在为单人作业研究kmeans功能。我们需要对一组数据运行欧几里得聚类,然后对另一组数据运行Jaccard。我们需要探索一些不同的模型来评估聚类的数量,对于欧几里得来说,使用 sklearn.metrics.silhouette_score 很简单,但这并没有提供使用Jaccard距离的选项。

正因为如此,我想知道是否有人对如何计算Jaccard距离有想法?我设法为彼此之间的所有距离创建一个矩阵。我还在欧几里得距离中使用了Elbow方法,这对于Jaccard也是一种有效方法吗?

1 个答案:

答案 0 :(得分:1)

使用metric =“ precomputed”

from sklearn.metrics import silhouette_score
silhouette_score(dist_matrix, k_means_cluster_ids, metric="precomputed")