哪种聚类算法更有可能给出预期的聚类结果

时间:2018-05-20 08:46:11

标签: machine-learning cluster-analysis

我给出了一组二维数据,格式如图1所示。布局和预期的聚类结果(用两种不同的颜色和符号)如图2所示。在常见的聚类方法中,哪个(哪些)更有可能给出预期的聚类结果?为什么?谢谢。

 Figure 1

Figure 1

 Figure 2

Figure 2

1 个答案:

答案 0 :(得分:1)

这个问题相当含糊。那么,"聚类方法"是什么意思?

我还是试一试:

乍一看,我猜想,有很多优秀的聚类算法不会很难聚集您的数据,显而易见的原因是,您的数据分离良好

要记住的另一件事是,您是否知道您对数据的期望数量,您实际上并未真正陈述,但这会对您想要的方法产生很大影响采取(或者你是否会添加一些确定聚类质量的度量标准,以便找到合适的聚类数量,例如Ellbow方法或一些熵测量)。

遵循一些可能对您有用的聚类方法:

  • k-means
  • 地区成长

我希望这能让你开始研究。