基本上,我使用Python模块scipy-cluster来绘制很多数据点。如果给出阈值或我想要的代表人数,是否有方法/功能给每个群集的代表?理想情况下,每个代表必须与其所属的集群中心的距离最近。
编辑:我正在寻找最接近每个群集中心的数据点。
答案 0 :(得分:1)
我真的不知道我在scipy-cluster周围的方式,但听起来它给你了质心坐标。鉴于信息和群集中哪些点的知识,计算群集中每个点的质心距离应该是微不足道的。只需确保您的计算基于您用于聚类的相同距离度量(可能是欧几里德距离)。
答案 1 :(得分:1)
Scipy-cluster为每个质心提供坐标,并识别每个群集中的哪些点。一旦你有了,我相信scipy.cluster.vq.py_vq
会给你观察和质心之间的距离。