当亲和矩阵稀疏时,为什么来自sklearn的SpectralClustering有效?

时间:2018-12-29 17:53:46

标签: python matrix scikit-learn

  

请参阅文档第2.3.5节:
  https://scikit-learn.org/stable/modules/clustering.html#spectral-clustering

文档说spectral clustering is especially efficient if the affinity matrix is sparse (and the pyamg module is installed)。我对稀疏矩阵的理解是,矩阵中的零比非零多。

当亲和度矩阵为“稀疏”时,这是否意味着总会减少查找亲和度矩阵的计算,从而使效率更高? 我的理由是,这些“稀疏零值”的距离为0,并且具有很高的相似性。

如果是这样,那么在准备频谱聚类分析之前,最好准备preprocessing.normalize而不是preprocessing.scale来准备数据...?

0 个答案:

没有答案