标签: python-3.x hierarchical-clustering
我正在尝试在具有欧几里得距离的Python中进行分层聚类。集群之一包含近80%的数据。我该如何处理?
答案 0 :(得分:0)
您的数据容易出现异常值吗?这可能意味着构成其他20%的其他数据点是异常值,并且来自错误的测量或类似的结果。...或者至少这些数据已从其他80%的高度移除...
采用包含80%的集群和构成其余20%的集群,并分别浏览其数据。