我正在使用apriori
包中的arules
函数来执行项目关联分析。将结果强制为datframe后,我注意到在某些情况下可以将输出分组,如下所示:
LHS RHS Support Confidence Lift Count
{Item1, Item2} {Item3} .84 0.99 12.3 6
是否有一种方法可以强制功能仅在每个事务中的两个项目之间执行分析并产生相应的支持,置信度等?换句话说,我可以强制apriori
将以上结果拆分为类似的内容吗?
LHS RHS Support Confidence Lift Count
{Item1} {Item3} a b c d
{Item2} {Item3} e f g h
答案 0 :(得分:0)
maxlen
不会在挖掘后充当过滤器。 apriori创建从1开始的频繁项目集,然后从2、3,...开始,maxlen
停止挖掘过程。
minlen
是一个筛选器,因为必须首先找到所有较短的频繁项集。
如果您询问是否可以确定
的支持和信心,{Item1} -> {Item3}
{Item2} -> {Item3}
仅依靠...的支持和信心
{Item1, Item2} -> {Item3}
那么答案是否定的。但是,通过apriori属性,我们至少了解以下内容:
supp({Item1} -> {Item3}) >= supp({Item1, Item2} -> {Item3})
supp({Item2} -> {Item3}) >= supp({Item1, Item2} -> {Item3})