如何计算聚类中的密度

时间:2013-06-27 06:26:04

标签: cluster-analysis dbscan

我正在处理具有2个坐标的数据集。目前我通过首先计算从每个点到其他点的总距离然后除以总点数来计算密度。我想知道这是计算密度的正确方法,因为我没有得到理想的结果。

这是群集文件https://dl.dropboxusercontent.com/u/45772222/samp.txt

此群集应具有3个群集 - > 2个椭圆和一个连接它们的管道 任何想法我怎么能把它们分开?

2 个答案:

答案 0 :(得分:0)

现在这是一个完整的玩具示例。

DBSCAN无法分离彼此接触的不同密度的群集。根据密度连通性的定义,它们必须由低密度区域分开。在您的玩具示例中,两个大型群集实际上是通过更高密度的区域连接。

基本上,这是基于非密度的聚类的示例...如果您希望基于密度的聚类能够分离这些聚类,则必须降低连接条的密度,使其密度低于聚类。 (但也许根本不打算使用这样的玩具例子)

答案 1 :(得分:0)

现在,这是一个完整的玩具示例。

DBSCAN无法分离彼此接触的不同密度的群集。根据密度连接的定义,它们必须被低密度区域隔开。在您的玩具示例中,两个大型群集实际上是通过较高密度的区域连接的。

因此,从本质上讲,这是基于非密度的群集的示例...如果希望基于密度的群集能够分离这些群集,则必须降低连接条的密度,使其密度低于连接密度。集群。 (但也许根本不用理会这类玩具示例)