使用R对混合类型的数据进行聚类

时间:2019-07-09 16:04:15

标签: r machine-learning cluster-analysis data-science unsupervised-learning

我有一个数据集,其中包含连续和分类类型的数据。对于分类数据,我有5个具有1-5个值的因子,它们实际上具有一定的顺序(常规数据)。

  • 我可以使用k-means聚类和欧式距离进行聚类,还是应该使用Gower距离?

  • 我应该将我的数据转换为标准归一化值吗?

  • 何时使用欧几里德距离和高尔距离?

  • 我们怎么知道我们已经形成了正确的集群?

0 个答案:

没有答案