我现在正在学习统计学习,使用python的pandas和scikit-learn库,它们对我来说都是很棒的工具。
我当然可以学习分类,回归以及与它们聚类的方法。
但是,当我想制作推荐模型时,我找不到如何从它们开始的方式。例如,如果我有一个客户的购买数据集,其中包含日期,产品名称,产品制造商,价格,订购设备等......
推荐的问题类型是什么?分类,回归还是其他什么?
事实上,当有人必须解决这个问题时,我发现有非常着名的算法,如协同过滤。
如果是这样,我可以使用scikit-learn来使用这些算法吗?或者我应该学习另一个M.L库?
此致
答案 0 :(得分:4)
Scikit-learn不提供任何推荐系统工具。您可以查看mahout,它可以很容易地启动命题或spark。
然而,推荐本身就是机器学习中的一个问题。如果您想要知道用户是否会喜欢这部电影(二元选择),那么如果您试图预测用户为电影或分类提供的费率,则可以进行回归。 重要的是推荐使用专用于此问题的工具和算法,如基于项目或基于内容的推荐。这些概念实际上很容易理解和实现自己一点推荐引擎可能是最好的。
我建议您阅读本书mahout in action,这是对推荐概念的一个很好的介绍
答案 1 :(得分:1)
Crab https://github.com/python-recsys/crab怎么样,这是一个Python框架,用于构建与科学Python包(numpy,scipy,matplotlib)世界集成的推荐引擎。
我没有使用过这个框架,只是发现了它。而且似乎只有0.1版本,而Crab已经多年没有更新。所以我怀疑它是否有详细记录。无论如何,如果您决定尝试Crab,请在此之后给我们反馈:)