应用错误收集

使用R对混合类型的数据进行聚类

时间：2019-07-09 16:04:15

标签： r machine-learning cluster-analysis data-science unsupervised-learning

我有一个数据集，其中包含连续和分类类型的数据。对于分类数据，我有5个具有1-5个值的因子，它们实际上具有一定的顺序（常规数据）。

我可以使用k-means聚类和欧式距离进行聚类，还是应该使用Gower距离？
我应该将我的数据转换为标准归一化值吗？
何时使用欧几里德距离和高尔距离？
我们怎么知道我们已经形成了正确的集群？

0 个答案:

没有答案