如何从条件FP树中找到频繁模式?

时间:2017-04-11 13:28:51

标签: pattern-matching classification data-mining apriori

鉴于下面的FP-tree:

enter image description here

对于项目E:

条件模式库是:

  

{B:1,A:1} {B:1,A:1,C:1}

从此条件FP树获得

  

{B:2,A:2}

但是如何从中获得频繁的模式呢?然后关闭频繁集和最大频繁集?

2 个答案:

答案 0 :(得分:1)

这取决于指定的最低支持。 假设最低支持是2:

对于项目E ..

您的条件基数: {B:1,A:1} {B:1,A:1,C:1}

你的F-List: {B:2,A:2}

因此频率模式: E:2,EB:2,EA:2 (通过对每组中项目的频率求和来检查,并检查它是> =至最小支持。

然后采取以下定义:

  • 项目集已关闭:所有直接超集都没有与项目集相同的支持

  • 项目集是最频繁的:它的直接超集都不常见

您需要计算其他条件库并检查超集是否符合上述定义。例如。 {B,A,C}是{B,A}的超集。

答案 1 :(得分:0)

你是什么意思" 获得频繁模式"?
在此示例中, {B,A} 是2个项目集,经常出现在 E 中。这意味着 A B 经常与 E 一起出现。每个项目的数字&#39; 2&#39; 代表支持,表示每个项目(A和B)看到<项目&#39; E&#39;

的时间很长>&#39; 2&#39;