标签: machine-learning statistics cluster-analysis similarity
假设我有一个元素对列表以及每个元素对应的相似度得分。我希望能够基于彼此之间的相似性将这个列表中的元素聚类。是否有确定的方法来执行此操作?
答案 0 :(得分:1)
您可以使用一些基于密度的聚类算法,例如DBSCAN或H-DBSCAN。例如,如果要查找一对p的邻居,它们位于epsilon周围,半径为p的圆内,则可以通过其{{1} }。因为如果1-sim(pi,p) < epsilon是sim(pi,p)和p之间的相似性,则pi将是这两点的距离。
p
epsilon
1-sim(pi,p) < epsilon
sim(pi,p)
pi