标签: r machine-learning cluster-analysis data-science unsupervised-learning
我有一个数据集,其中包含连续和分类类型的数据。对于分类数据,我有5个具有1-5个值的因子,它们实际上具有一定的顺序(常规数据)。
我可以使用k-means聚类和欧式距离进行聚类,还是应该使用Gower距离?
我应该将我的数据转换为标准归一化值吗?
何时使用欧几里德距离和高尔距离?
我们怎么知道我们已经形成了正确的集群?