sklearn如何计算最近邻亲和矩阵用于谱聚类?

时间:2017-07-13 21:33:40

标签: scikit-learn nearest-neighbor

天真地,如果我指定最近邻居的数量为k,那么对于每个节点,它会伸出来找到最近的k个节点并将它们的亲和度指定为1。

然而,我观察到由sklearn谱聚类最近邻生成的亲和度矩阵不仅包含0和1。是因为最近邻居名单中可能存在联系吗?所以我将1 / n分配给n个相同的相邻节点?

1 个答案:

答案 0 :(得分:0)

亲和度矩阵中的值通过sklearn谱聚类与"最近邻居"选项为0,1 / 2和1。

值0和1很容易理解,但1/2条目是如何产生的?

注意,k最近邻的概念相对于两个节点是不对称的,因此,使用k-nearest-neighor获得的亲和度矩阵A是不对称的。但是谱聚类中使用的相似度矩阵是对称的,因此,谱聚类取A和A的平均值。

1/2值来自A中的不对称元素。