使用欧氏距离对混合数据进行聚类

时间:2019-07-14 11:02:34

标签: machine-learning cluster-analysis k-means

我有一个数据集,其中包含连续和分类类型的数据。

任何人都可以解决以下问题。

我可以使用k均值聚类和欧几里得距离还是应该使用高尔距离?

何时使用欧几里德距离/高尔距离?

我们怎么知道我们已经形成了正确的集群?

1 个答案:

答案 0 :(得分:0)

在实数的向量空间上定义K-均值和欧几里得距离。因此,它们未在混合数据上定义。因此,您不能使用它们,它不是k-均值/欧几里德距离,而是其他一些东西。

如果您对文学进行一些研究,则有很多选择。

从不不知道您是否拥有“正确的”群集,因为没有“正确的”或“错误的”群集之类的东西。这是主观的,不是客观的。