我在R中使用arules包来计算具有850列和1335行的数据帧的规则,这些行主要包含我们已将逻辑和字符转换为因子的逻辑,数字和字符数据。
当我通过使用以下代码设置用于生成规则的lhs的子集(几乎任何一个)时,遇到以下问题。请注意,整套规则有12,50,388条规则:
apriori(newdata,parameter=list(minlen=1,maxlen=4,supp=0.6,conf=0.6,originalSupport=FALSE,ext=TRUE),
appearance= list(lhs=lhs1,rhs=rhs1,default="none"),
control = list(memopt=TRUE,load=FALSE))
r-studio第一次工作,但随后无法工作,screenshot here.
第二次,很长一段时间后会话失败,screenshot here.
可重现的例子:
library("arules")
data("Adult")
ndat<- as(Adult,"transactions")
#List of items
item1<-ndat@itemInfo
#Defining a target column
tar_var<-colnames(Adult)[ncol(Adult)]
#Defining LHS and RHS
rhs1<-item1$labels[item1$variables==tar_var]
lhs1<-item1$labels[item1$variables!=tar_var]
#taking a sample of half the length of the original data
lhs2<-sample(lhs1,round(length(lhs1)/2,0))
#Code for generating rules that kills the session
system.time(rule_gen<- apriori(ndat,parameter=list(minlen=1,maxlen=2+1,supp=0,conf=0,originalSupport=FALSE,ext=TRUE),
appearance= list(lhs=lhs2,default="rhs"),control = list(memopt=TRUE,load=FALSE)) )
请帮帮我,我正在使用Windows PC,4 GB内存。提前谢谢。