关联规则挖掘中的最大与封闭模式

时间:2015-09-05 14:41:18

标签: machine-learning data-mining

在关联规则挖掘的频繁项集生成中,最大值和最大值之间的根本区别是什么?封闭模式项目集。有人可以指导我一个关于他们的资源吗?

4 个答案:

答案 0 :(得分:2)

来自this original source

  

封闭模式是一种常见的模式。所以它符合最低要求   支持标准。除此之外,所有超级模式都是封闭的   模式不如封闭模式频繁。

     

让我们看一些例子。

     

假设,最小支持计数为2.对于第一个示例,   假设总共有3个项目:a,b,c。假设一个模式ab   支持计数为2,模式abc支持计数为2.是   模式ab是一个封闭的模式?模式ab是一种常见的模式,   但它的超级模式不比ab低。

     

对于第二个例子,

     

假设总共有3个项目:x,y,z。假设一个模式xy   支持计数为3,模式xyz支持计数为2.是   模式xy是一个封闭的模式?模式xy是一种常见的模式   并且唯一的超模式xyz比xy更少。

     

因此,xy是一个封闭的模式。

     

最大模式是

     

频繁的模式。所以它也符合最低支持标准   封闭模式此外,但不像封闭模式,所有   最大模式的超级模式不是频繁模式。

     

我们也看一些例子。

     

假设,最小支持计数为2.与之前一样,第一个   例如,假设总共有3个项目:a,b,c。假设一个   模式ab的支持计数为3,模式abc具有支持计数   2.模式ab是最大模式吗?模式ab是一种常见的   模式,但它有一个超级模式,这是一个频繁的模式   好。因此,模式ab不是最大模式。

     

对于第二个例子,

     

假设总共有3个项目:x,y,z。假设一个模式xy   支持计数为3,模式xyz支持计数为1.是   模式xy是最大模式?模式xy是一种常见的模式   唯一的超模式xyz也不是常见的模式。因此,   xy是最大模式。

答案 1 :(得分:0)

我认为你的问题涉及最大频繁项目集和关闭频繁项目集。

它们之间的主要区别是

@maximal frequency itemset不提供其子集的支持计数。

@closed频繁项目集保留其项目集的支持计数。

您可以参考以下链接,以便更好地了解关联挖掘以及最大和最大频繁项集。

http://www-users.cs.umn.edu/~kumar/dmbook/ch6.pdf

答案 2 :(得分:0)

频繁项目集挖掘:

  
      
  • 最大项目集是没有频繁超集的项目集。
  •   
  • 已关闭的项目集是没有具有相同支持的超集的项目集。
  •   

最大项目集是已关闭项目集的子集,它是所有频繁项目集的子集。

您可以使用示例作为SPMF data mining library的一部分来获取闭合和最大项集挖掘算法(FPMax,FPClosed,DCI_Closed,CHarm等)的实现。 (我是作者)

答案 3 :(得分:0)

频繁项目集挖掘:

如果X是频繁模式并且不存在频繁的超级模式Y(其中Y是X的超集),则称X是 max-pattern 。最大模式是有损压缩形式,因为基础支持信息丢失。

另一方面,如果X是频繁的并且没有出现超级模式Y(其中Y是X的超集),并且具有相同的支持,则X被称为闭合模式。 X. Closed Patterns是无损压缩形式,因为支持信息存储在模式中。