R和MapReduce查找关联规则

时间:2014-12-09 08:54:37

标签: r hadoop mapreduce arules

我刚开始使用hadoop,我需要用它来计算一个非常大的数据集的关联规则。 我不能强调如何使用R Hadoop和MapReduce从数据集关联规则中查找。 我有事务矩阵,但我需要做什么来执行apriori算法与这个矩阵与hadoop? 这是用于执行apriori(package arules)的命令

rules <- apriori(incidence.matrix , parameter = list(minlen=2, supp=0.09, conf=0.95))

我需要在reduce函数的map函数中使用它吗?

1 个答案:

答案 0 :(得分:0)

我遇到了同样的问题(R崩溃了arule的大数据集),你可以使用 Mahout ,它是Hadoop之上的机器学习引擎,它有关联规则和其他机器学习算法(如聚类......等)