有些电子商务平台有一个建议功能,一旦你在篮子里有一个项目“你可能也喜欢这个产品”,他们会告诉你。有些像亚马逊一样,依赖于先前存在的客户行为数据,他们的功能被称为“买了这个项目的客户也买了”,但有些人似乎通过其他方式提出建议。
这些“其他手段”是什么?他们在网络商店中使用哪种算法来实现此功能?
答案 0 :(得分:6)
他们使用数据挖掘,你要问的这个特殊算法被称为“最近邻居”算法。
这是我在算法上写的文章的链接(以及许多其他文章)。
http://www.ibm.com/developerworks/opensource/library/os-weka3/index.html
答案 1 :(得分:6)
该流程称为Business Intelligence
,数据将存储在数据仓库中,商业智能流程可以使用SSAS
等产品使用。该过程将涉及将数据量(谁购买了什么以及何时)分组到data cubes
。对这些立方体进行分析并用于将您的购买与购买相同产品的其他人进行比较,然后推荐他们购买(购买此产品的其他客户,也购买此商品....项目X)。其他各种AI算法用于比较其他客户趋势的模式,例如他们如何购物,他们点击的位置等。所有这些数据被累积,然后被添加到数据立方体进行分析。
下面概述了数据挖掘算法,您可以查找Decision Tree Modelling algorithm
,这是BI如何确定趋势和模式(在本例中为建议):
答案 2 :(得分:2)
关于此类算法的最佳书籍是:Programming Collective Intelligence
答案 3 :(得分:2)
电子商务页面上的大多数建议都是使用某种推荐系统(http://en.wikipedia.org/wiki/Recommender_system)创建的。像Mahout(http://mahout.apache.org/)这样的工具已经实现了最常见的方法。
答案 4 :(得分:2)
正如之前的一些人回答的那样,这被称为推荐引擎。它也被称为协同过滤技术。很少有工具可以做到这一点,Mahout就是其中之一。请参阅我撰写的博客,其中讨论了我们使用Mahout and Hadoop to build a recommendation engine的用例。作为这方面的前身,我还写了一个Component architecture,其中每个都是如何组合起来解决数据挖掘问题的。
Mahout将在独立模式下运行,也可以在Hadoop中运行。使用任何一个的决定实际上归结为需要挖掘的历史数据的大小。如果数据大小为Terabytes和Petabytes,则通常使用Mahout和Hadoop。 Weka是另一个类似的开源项目。所有这些都属于称为机器学习框架的类别。我希望它有所帮助。