R关联规则先验-禁止项目分组

时间:2019-03-21 17:01:03

标签: r dataframe arules

我正在使用apriori包中的arules函数来执行项目关联分析。将结果强制为datframe后,我注意到在某些情况下可以将输出分组,如下所示:

 LHS                 RHS        Support        Confidence      Lift        Count
{Item1, Item2}      {Item3}      .84             0.99          12.3          6

是否有一种方法可以强制功能仅在每个事务中的两个项目之间执行分析并产生相应的支持,置信度等?换句话说,我可以强制apriori将以上结果拆分为类似的内容吗?

 LHS           RHS        Support        Confidence      Lift       Count
{Item1}      {Item3}        a                b            c           d
{Item2}      {Item3}        e                f            g           h

1 个答案:

答案 0 :(得分:0)

先验中的

maxlen不会在挖掘后充当过滤器。 apriori创建从1开始的频繁项目集,然后从2、3,...开始,maxlen停止挖掘过程。

另一方面,

minlen是一个筛选器,因为必须首先找到所有较短的频繁项集。

如果您询问是否可以确定

的支持和信心,
{Item1} -> {Item3}
{Item2} -> {Item3}

仅依靠...的支持和信心

{Item1, Item2} -> {Item3}

那么答案是否定的。但是,通过apriori属性,我们至少了解以下内容:

supp({Item1} -> {Item3}) >= supp({Item1, Item2} -> {Item3})
supp({Item2} -> {Item3}) >= supp({Item1, Item2} -> {Item3})