标签: cluster-analysis data-mining
群集有很多有效性索引,但仅适用于数字数据。混合数据(数字和分类)的聚类怎么样?
答案 0 :(得分:1)
同样的方式,主要是。
你显然不能使用惯性,但任何基于距离的(并且不使用群集均值)将适用于您用于聚类的距离。例如,剪影。
不幸的是,我认为这些数据的距离函数不是很值得信赖。祝你好运,并在使用它们之前对所有结果进行三重检查,因为你可能会得到无意义的结果,只有在压缩到这个单一的得分数时才会看起来很好。