R中的Apriori(关联规则学习)以日期作为变量?

时间:2016-05-26 18:46:56

标签: r apriori

使用像apriori这样的算法挖掘关联规则时是否可以包含日期变量?假设“发票ID”无法明确定义客户购买集,但我们仍有电子邮件地址。如果鲍勃买了牛奶,6个月后鲍勃买了大米,就不应该有关于牛奶和大米的关联规则(或者可能是弱支持的关联规则)。但是,如果bob购买牛奶并且一天后购买大米,则应该有关联规则(并且支持应该反映日期的接近程度)。

1 个答案:

答案 0 :(得分:0)

如果您不坚持apriori,请查看

library(arulesSequences)
lst<- list(
  "bob"=c("milk", "cacao", "beer", "diapers"),
  "lily"=c("flowers", "card")
)
trans <- as(as.list(unlist(lst)), "transactions")
transactionInfo(trans)$sequenceID <- rep(names(lst), lengths(lst))
transactionInfo(trans)$eventID <- as.integer(Sys.Date() + c(0, 6, 60, 60+6*30, 0, 31))
s <- cspade(trans, param=list(maxgap=30))
inspect(s[size(s)>1])
 #   items     support 
 # 1 <{milk},   
 #    {cacao}>     0.5 

maxgap在示例中需要30天。您可能想要调整它。