我刚开始使用hadoop,我需要用它来计算一个非常大的数据集的关联规则。 我不能强调如何使用R Hadoop和MapReduce从数据集关联规则中查找。 我有事务矩阵,但我需要做什么来执行apriori算法与这个矩阵与hadoop? 这是用于执行apriori(package arules)的命令
rules <- apriori(incidence.matrix , parameter = list(minlen=2, supp=0.09, conf=0.95))
我需要在reduce函数的map函数中使用它吗?
答案 0 :(得分:0)
我遇到了同样的问题(R崩溃了arule的大数据集),你可以使用 Mahout ,它是Hadoop之上的机器学习引擎,它有关联规则和其他机器学习算法(如聚类......等)