在python中使用机器学习基于他们喜欢的用户聚类用户

时间:2018-04-28 09:29:10

标签: python-3.x machine-learning dataset cluster-analysis

用户ID和喜欢如下

  1. 牛奶,咖啡,茶,糖
  2. 凝乳,盐,糖
  3. 牛奶,糖,茶
  4. 凝乳,稻
  5. 我希望根据用户喜欢

    对用户进行聚类

1 个答案:

答案 0 :(得分:-1)

你可以遵循这种方法

将用户的偏好转换为向量,每个索引对应一些产品,如果用户喜欢,则值为1,否则为

user 1 -> [1,1,1,1,0,0]
user 2 -> [0,0,0,1,1,1]
...

现在您可以轻松使用具有欧几里德距离的KNN模型,或者使用其他一些相似性方法,您可以使用最基本且最简单的sklearn lib集群实现

有更多细节,例如提供的代码,输出,逻辑等......我可以更具体案例