基本市场篮子/推荐分析问题

时间:2014-05-19 09:47:41

标签: python algorithm sorting recommendation-engine

我对市场购物篮分析/推荐算法有疑问。使用Python,我为我爸爸的商店创建了一个非常基本的推荐算法(如果你甚至可以称之为)。基本上,它需要购买物品X和Y作为购买物品X和其他任何东西的百分比。 (根据我的理解,这是Jaccard Index的想法)我试图模仿像亚马逊这样的大商店用“看过这个项目的顾客也买了”的功能。

我的问题是我不知道如何滤除所有的噪音。例如,很多人买香蕉。所以香蕉总是表现为其他物品的“高可能性”,即使它与一种有趣的方式无关。是否有其他基本统计技术来过滤掉常用的商品?我目前的技术减轻了影响,但仍然存在。

谢谢!

1 个答案:

答案 0 :(得分:0)

您在询问Collaborative Filtering。一种方法是训练neural network,通常有一个隐藏层 1 ,输入层和输出层将为您的商店中的每个项目都有一个perceptron。用人喜欢的产品喂它,这将导致该用户喜欢的每件物品的可能性(或分类,取决于你训练你的网络的方式)。
然后使用back-propogation algorithm

使用现有客户群培训模型

这种方法并不是试图找到一个和你相似的人。 - 而是为用户构建配置文件,并根据此配置文件建议项目。

由于您使用的是python,因此可以使用scikit-learn并使用这些算法的现有实现

还存在更先进的机制,总的来说 - 这个研究领域不断发展。 Netflix Prize challenge围绕同一主题展开。


(1)隐藏层代表分类 - 例如食物,工具,书籍......但是,算法会为您找到一些分类,您需要做的就是在网络中告诉您需要多少类别建筑。拥有多个隐藏图层可以表示子类别。