混合类型数据类型的距离函数类型是什么?

时间:2020-04-06 22:58:39

标签: binary dataset cluster-analysis distance ordinal

亲爱的

在聚类中,我认为距离函数的选择取决于数据类型。如果我们有混合类型的数据类型,如(连续)和类别(标称和/或有序)刻度和二进制标称变量,该怎么办? 在这种情况下,是否有针对特定距离函数类型的指南? 如果不是,我想二进制标称变量的合适选择是什么?

谢谢, shosho

1 个答案:

答案 0 :(得分:0)

Kaufman和Rousseeuw撰写的《数据中的查找组》一书涵盖了适用于不同类型数据的各种算法,并对如何处理混合变量类型做了一些解释。它们包括有关二进制变量的信息。

https://onlinelibrary.wiley.com/doi/book/10.1002/9780470316801