我在一个需要提供一组没有特定订单的选项的网站上工作。我需要根据查看列表的客户对此列表进行排序。我想通过生成推荐规则并对列表进行排序来做到这一点,最适合客户喜欢的列表。此外,我认为如果对推荐的信心很高,我会很高兴,我可以告诉客户为什么我推荐这个。
例如,假设我们有一个冰淇淋联合会,其网站上的客户可以在线注册和订购。客户信息包含性别,DOB,地址等基本信息。我的目标是挖掘客户以前的订单,以生成格式为
的规则 feature -> flavor
其中,功能可以是个人资料中的信息,也可以是订单本身(例如,我们可能会询问您期望服务的人数,年龄等)。 然后,我会提出适用于当前客户的规则,并将更有信心的规则放在列表顶部。
我的问题是,解决此问题的最佳标准算法是什么?我有一些apriori的经验,最初我想过使用它,但因为我只对1个结果感兴趣,我现在想,也许其他选择可能更适合。但无论如何我对机器学习知之甚少,所以我很感激任何帮助和参考。
答案 0 :(得分:2)
这是推荐问题。
首先,apriori算法不再是推荐系统的最新技术。 (相关讨论在这里:Using the apriori algorithm for recommendations)。
查看以下书籍挖掘海量数据集的第9章推荐系统。这是一个很好的教程。
http://infolab.stanford.edu/~ullman/mmds.html
基本上,您有两种不同的方法:基于内容和协作过滤。后者可以基于项目或基于用户的方法来完成。还有一些方法可以将这些方法结合起来以获得更好的建议。
可能有用的一些进一步阅读:
最近一份关于推荐系统的调查报告: http://arxiv.org/abs/1006.5278
亚马逊逐项协同过滤:http://www.cs.umd.edu/~samir/498/Amazon-Recommendations.pdf
矩阵分解技术:http://research.yahoo4.akadns.net/files/ieeecomputer.pdf
Netflix挑战:http://blog.echen.me/2011/10/24/winning-the-netflix-prize-a-summary/
Google新闻个性化:http://videolectures.net/google_datar_gnp/
一些相关的stackoverflow主题: