将数据转换为特征向量

时间:2020-10-05 09:24:23

标签: python-3.x scikit-learn k-means demographics feature-clustering

我有来自MovieLens数据的用户人口统计信息。我正在尝试在其上应用kmeans算法。

Age  Occupation  Zip-code
0       1          10     48067
1      56          16     70072
2      25          15     55117
3      45           7      2460
4      25          20     55455

我想将其转换为这样的特征向量

f1,f2,f3, . ........ , f27

每个值都转换为特征例如 年龄将被转换为7个特征,例如<18,18-25,依此类推

如何通过读取CSV文件或数据框来做到这一点。

0 个答案:

没有答案