python - k-means在python中聚类多列数据

k-means在python中聚类多列数据

时间：2018-04-22 02:32:29

标签： python cluster-analysis k-means data-science

我的数据集在文本文件中包含2000行。每条线代表人体20个骨骼关节点的x，y，z（3D坐标位置）（例如：头部，肩部中心，肩部左侧，肩部右侧，......，肘部左侧，肘部右侧）。我想对这些数据进行k-means聚类。数据由“空格”分隔，每个关节由3个值（表示x，y，z坐标）表示。像左肩所代表的头肩中心 .0255 ... .01556600 1.3000 ... .0243333 .010000 .1.3102000 ....

所以基本上我每行有60列，它代表20个关节，每个连接由三个点组成。

我的问题是如何格式化或使用这些数据进行k-means聚类，

1 个答案:

答案 0 :(得分：0)

您无需重新格式化任何内容。

每一行都是连续值的60维向量，具有可比较的比例（坐标），如k-means所需。

你可以在这上面运行k-means。

但是假设测量是按顺序进行的，你可能会观察到行之间的强相关性，所以我不希望数据聚集得非常好，除非你设置用来做和保持某些姿势。