谱聚类与层次聚类

时间:2016-04-15 17:01:27

标签: cluster-analysis data-mining hierarchical-clustering spectral

任何人都可以解释一下,在光谱聚类中使用层次聚类是否有任何优势?我知道它们是如何工作的,但我想知道在哪种情况下使用层次聚类比光谱聚类更好。

2 个答案:

答案 0 :(得分:2)

分层聚类通常更快,并且可以生成一个很好的树状图来研究。

如果你有一个很好的聚类,树形图非常有用。

此外,层次聚类非常灵活。您可以使用不同的距离函数和不同的链接策略。

光谱聚类有一个有趣的理论;但为了更好地工作,您的数据必须已经包含良好分离的“连接组件”。当你有非常嘈杂的数据时,祝你好运。

答案 1 :(得分:2)

分层聚类:

  • 这对分类数据很有用。
  • 保持连接相似点,直到最终得到包含所有数据点的单个群集。
  • 从组合所有数据后得到的分组中,它被称为树状图。
  • 根据您想要的簇数量,您可以在一个级别上剪切树形图。

光谱聚类:

  • 用于聚类形状复杂的数据,如K-means和基于密度的聚类在这些情况下失败。
  • 将数据点作为图形的顶点处理,连接足够接近的顶点。因此,您还可以选择ε值。比ε更近的所有顶点都是连接的。
  • 与分层聚类不同,您不会获得完全连接的单个图形(除非您采用高ε值且没有未连接的组件)。相反,您会获得多个连接的组件,每个组件代表一个集群。