我一直致力于市场购物篮分析,在R中采用apriori方法,数据包含12个变量和21,00,000个观测值,我的笔记本电脑有4 GB RAM,我的R代码没有运行将数据转换成交易。请帮忙。
答案 0 :(得分:0)
我过去曾为更大的数据集研究apriori算法。我遇到了类似的问题。为了暂时解决它,我使用了采样。后来我把它变成了几行spark实现,它永久地解决了我的问题。
https://spark.apache.org/docs/1.6.0/mllib-frequent-pattern-mining.html