如何基于属性的子集(4个属性)对数据进行聚类?

时间:2019-03-21 13:18:59

标签: python cluster-analysis data-mining data-analysis hierarchical-clustering

我有一个pandas DataFrame,它保存某些对象的数据,其中包括对象的某些部分(左,上,右,下)的位置。

例如:

ObjectID    Left, Right, Top, Bottom
1            0      0     0      0
2            20    15     5      5
3            3      2     0      0

如何基于这4个属性来聚类对象? 您有没有向我推荐的聚类算法/技术?

2 个答案:

答案 0 :(得分:0)

几乎所有聚类算法都是 multivariate ,可在此处使用。所以你的问题太广泛了。

首先应该考虑适当的距离度量。

任何建议都是可行的,因为我们不知道您的数据是分布的

答案 1 :(得分:0)

根据数据类型和最终目标,您可以尝试k均值,k模式或k原型。如果您的数据混合了分类变量或连续变量,则可以尝试partition around medoids算法。但是,如另一位用户先前所述,您能否提供有关数据类型及其差异的更多信息。