我在一个事务对象上使用了arules包中的apriori命令,其中一个CPU上升到大约97%,大约20分钟左右。然后它下降到0.7%和0.3%之间的循环,并且已经这样做了大约24小时。而我在RStudio中没有提示;只是眨眼。我有2666笔交易和376件商品。某些交易可能有很多相似之处,这意味着某些交易可以共享100多个项目。
这是我第一次使用这个包,所以我想知道这种行为是否正常或我应该怎么做。
我在CentOS 7上运行24 GB RAM和16个CPU,并使用RStudio Server。
我的命令:
rules <- apriori(adjacdmMtrans, parameter =list(support = 0.002, confidence=0.75))
输入上述命令后arules发布的一些信息:
Apriori
Parameter specification:
confidence minval smax arem aval originalSupport support minlen maxlen target ext
0.75 0.1 1 none FALSE TRUE 0.002 1 10 rules FALSE
Algorithmic control:
filter tree heap memopt load sort verbose
0.1 TRUE TRUE FALSE TRUE 2 TRUE
Absolute minimum support count: 5
set item appearances ...[0 item(s)] done [0.00s].
set transactions ...[376 item(s), 2666 transaction(s)] done [0.03s].
sorting and recoding items ... [376 item(s)] done [0.01s].
creating transaction tree ... done [0.00s].
checking subsets of size 1 2 3 4
答案 0 :(得分:0)
您的计算机可能内存不足以进行R进程并开始交换。在更糟糕的情况下,apriori必须以10 ^ 12个长度为4的候选者的顺序创建376个项目。从更高的支持值开始。