请参阅文档第2.3.5节:
https://scikit-learn.org/stable/modules/clustering.html#spectral-clustering
文档说spectral clustering is especially efficient if the affinity matrix is sparse (and the pyamg module is installed)
。我对稀疏矩阵的理解是,矩阵中的零比非零多。
当亲和度矩阵为“稀疏”时,这是否意味着总会减少查找亲和度矩阵的计算,从而使效率更高? 我的理由是,这些“稀疏零值”的距离为0,并且具有很高的相似性。
如果是这样,那么在准备频谱聚类分析之前,最好准备preprocessing.normalize
而不是preprocessing.scale
来准备数据...?