我有来自MovieLens数据的用户人口统计信息。我正在尝试在其上应用kmeans算法。
Age Occupation Zip-code
0 1 10 48067
1 56 16 70072
2 25 15 55117
3 45 7 2460
4 25 20 55455
我想将其转换为这样的特征向量
f1,f2,f3, . ........ , f27
每个值都转换为特征例如 年龄将被转换为7个特征,例如<18,18-25,依此类推
如何通过读取CSV文件或数据框来做到这一点。