如何评估群集的混合数据准确性,如K-Prototype>

时间:2018-01-14 11:57:20

标签: cluster-analysis data-mining

群集有很多有效性索引,但仅适用于数字数据。混合数据(数字和分类)的聚类怎么样?

1 个答案:

答案 0 :(得分:1)

同样的方式,主要是。

你显然不能使用惯性,但任何基于距离的(并且不使用群集均值)将适用于您用于聚类的距离。例如,剪影。

不幸的是,我认为这些数据的距离函数不是很值得信赖。祝你好运,并在使用它们之前对所有结果进行三重检查,因为你可能会得到无意义的结果,只有在压缩到这个单一的得分数时才会看起来很好。