将R中的分类值聚类

时间:2018-10-16 16:20:31

标签: python r cluster-analysis

我需要对混合数据进行聚类(2列:1-数字和2-字符串)。在R或python中是否有一个软件包可以处理混合数据或分类数据的聚类?

谢谢!

1 个答案:

答案 0 :(得分:0)

对于R,我建议使用daisy包中的cluster函数。

您可以有matrix个混合数据类型,标称-序数-数字。

如果混合使用数据,则将计算每个变量的gower距离,基本上将每个标称值转换为数值,并通过各个分量贡献的平均值进行度量。

即使所有变量都是数字,也可以使用它,在这种情况下,它将使用标准指标。

有关更多信息和示例,请参见the help page

Here关于行距的介绍。