我给出了一组二维数据,格式如图1所示。布局和预期的聚类结果(用两种不同的颜色和符号)如图2所示。在常见的聚类方法中,哪个(哪些)更有可能给出预期的聚类结果?为什么?谢谢。
Figure 1
Figure 2
答案 0 :(得分:1)
这个问题相当含糊。那么,"聚类方法"是什么意思?
我还是试一试:
乍一看,我猜想,有很多优秀的聚类算法不会很难聚集您的数据,显而易见的原因是,您的数据分离良好。
要记住的另一件事是,您是否知道您对数据的期望数量,您实际上并未真正陈述,但这会对您想要的方法产生很大影响采取(或者你是否会添加一些确定聚类质量的度量标准,以便找到合适的聚类数量,例如Ellbow方法或一些熵测量)。
遵循一些可能对您有用的聚类方法:
我希望这能让你开始研究。