k-means在python中聚类多列数据

时间:2018-04-22 02:32:29

标签: python cluster-analysis k-means data-science

我的数据集在文本文件中包含2000行。 每条线代表人体20个骨骼关节点的x,y,z(3D坐标位置)(例如:头部,肩部中心,肩部左侧,肩部右侧,......,肘部左侧,肘部右侧)。我想对这些数据进行k-means聚类。 数据由“空格”分隔,每个关节由3个值(表示x,y,z坐标)表示。像左肩所代表的头肩中心 .0255 ... .01556600 1.3000 ... .0243333 .010000 .1.3102000 ....

所以基本上我每行有60列,它代表20个关节,每个连接由三个点组成。

我的问题是如何格式化或使用这些数据进行k-means聚类,

1 个答案:

答案 0 :(得分:0)

您无需重新格式化任何内容。

每一行都是连续值的60维向量,具有可比较的比例(坐标),如k-means所需。

你可以在这上面运行k-means。

但是假设测量是按顺序进行的,你可能会观察到行之间的强相关性,所以我不希望数据聚集得非常好,除非你设置用来做和保持某些姿势。