关联规则算法

时间:2018-01-12 13:59:12

标签: r data-mining

我在csv文件中有这个交易。

A

I1,I2,I5 I2,I4 I2,I3 I1,I2,I4 I1,I3 I2,I3 I1,I3 I1,I2,I3,I5 I1,I2,I3 support=0.02关联规则为confidence=0.8{I1, I2, I3}。这来自Data Mining,Concepts and Techniques一书 我在R中编写了代码并且通过这种支持我只得到一条规则{I1, I2, I5}

R中的代码:

{I1,I2,I5}

enter image description here

1 个答案:

答案 0 :(得分:0)

{I1,I2,I3} 不是关联规则

这是频繁的项目集

关联规则的左侧必须是频繁的项目集,但不是每个频繁的项目集都会出现在规则的左侧。

因此,您不能依赖查看关联规则的lhs来查找所有频繁项目集。

在您的Apriori关联规则中,最后两个规则是从项集{I1,I2,I3,I5}生成的(lhd的 union 和rhs也必须是频繁的项集)。但是,如果您想要查找频繁的项目集,请不要依赖关联规则。它们并不完全相同。