Python中异常大的群集大小分层群集

时间:2018-09-18 17:16:03

标签: python-3.x hierarchical-clustering

我正在尝试在具有欧几里得距离的Python中进行分层聚类。集群之一包含近80%的数据。我该如何处理?

1 个答案:

答案 0 :(得分:0)

您的数据容易出现异常值吗?这可能意味着构成其他20%的其他数据点是异常值,并且来自错误的测量或类似的结果。...或者至少这些数据已从其他80%的高度移除...

采用包含80%的集群和构成其余20%的集群,并分别浏览其数据。