使用python混合数据的聚类

时间:2019-05-16 10:29:26

标签: python cluster-analysis

我正在尝试使用基于Huang,Z.的k_prototype聚类对包含混合数据(标称和有序)的数据集进行聚类:对具有混合数值和分类值的大型数据集进行聚类。 我的问题是如何找到最佳的簇数?

1 个答案:

答案 0 :(得分:0)

没有最佳数目的群集。但是几十个。每种启发式方法都将为另一个定义不佳的“最优”概念建议一个不同的“最优”数字,该概念可能与您首先要解决的问题无关。

与其过度关注“最优性”,不如探索和试验更多。研究您实际想要达到的目标,以及如何将其转换为数学形式,以便能够计算出解决您的问题的方法,以及解决别人的问题的方法。