scikit-learn:聚类数据集中的标识属性

时间:2015-06-19 23:08:20

标签: python machine-learning scikit-learn

在scikit-learn中执行KMeans聚类时,我需要提供形状(n_samples, n_features)的数据集。数据集的每个样本对应于由user_id标识的用户,该用户不完全是一个特征。因此,如果以这种格式提供数据集,我将丢失每个样本的标识信息。

那么,如何在数据集中存储user_ids?

0 个答案:

没有答案