我正在为单人作业研究kmeans功能。我们需要对一组数据运行欧几里得聚类,然后对另一组数据运行Jaccard。我们需要探索一些不同的模型来评估聚类的数量,对于欧几里得来说,使用 sklearn.metrics.silhouette_score 很简单,但这并没有提供使用Jaccard距离的选项。
正因为如此,我想知道是否有人对如何计算Jaccard距离有想法?我设法为彼此之间的所有距离创建一个矩阵。我还在欧几里得距离中使用了Elbow方法,这对于Jaccard也是一种有效方法吗?
答案 0 :(得分:1)
使用metric =“ precomputed”
from sklearn.metrics import silhouette_score
silhouette_score(dist_matrix, k_means_cluster_ids, metric="precomputed")