在关联规则挖掘的频繁项集生成中,最大值和最大值之间的根本区别是什么?封闭模式项目集。有人可以指导我一个关于他们的资源吗?
答案 0 :(得分:2)
封闭模式是一种常见的模式。所以它符合最低要求 支持标准。除此之外,所有超级模式都是封闭的 模式不如封闭模式频繁。
让我们看一些例子。
假设,最小支持计数为2.对于第一个示例, 假设总共有3个项目:a,b,c。假设一个模式ab 支持计数为2,模式abc支持计数为2.是 模式ab是一个封闭的模式?模式ab是一种常见的模式, 但它的超级模式不比ab低。
对于第二个例子,
假设总共有3个项目:x,y,z。假设一个模式xy 支持计数为3,模式xyz支持计数为2.是 模式xy是一个封闭的模式?模式xy是一种常见的模式 并且唯一的超模式xyz比xy更少。
因此,xy是一个封闭的模式。
最大模式是
频繁的模式。所以它也符合最低支持标准 封闭模式此外,但不像封闭模式,所有 最大模式的超级模式不是频繁模式。
我们也看一些例子。
假设,最小支持计数为2.与之前一样,第一个 例如,假设总共有3个项目:a,b,c。假设一个 模式ab的支持计数为3,模式abc具有支持计数 2.模式ab是最大模式吗?模式ab是一种常见的 模式,但它有一个超级模式,这是一个频繁的模式 好。因此,模式ab不是最大模式。
对于第二个例子,
假设总共有3个项目:x,y,z。假设一个模式xy 支持计数为3,模式xyz支持计数为1.是 模式xy是最大模式?模式xy是一种常见的模式 唯一的超模式xyz也不是常见的模式。因此, xy是最大模式。
答案 1 :(得分:0)
我认为你的问题涉及最大频繁项目集和关闭频繁项目集。
它们之间的主要区别是
@maximal frequency itemset不提供其子集的支持计数。
@closed频繁项目集保留其项目集的支持计数。
您可以参考以下链接,以便更好地了解关联挖掘以及最大和最大频繁项集。
答案 2 :(得分:0)
频繁项目集挖掘:
- 最大项目集是没有频繁超集的项目集。
- 已关闭的项目集是没有具有相同支持的超集的项目集。
最大项目集是已关闭项目集的子集,它是所有频繁项目集的子集。
您可以使用示例作为SPMF data mining library的一部分来获取闭合和最大项集挖掘算法(FPMax,FPClosed,DCI_Closed,CHarm等)的实现。 (我是作者)
答案 3 :(得分:0)
频繁项目集挖掘:
如果X是频繁模式并且不存在频繁的超级模式Y(其中Y是X的超集),则称X是 max-pattern 。最大模式是有损压缩形式,因为基础支持信息丢失。另一方面,如果X是频繁的并且没有出现超级模式Y(其中Y是X的超集),并且具有相同的支持,则X被称为闭合模式。 X. Closed Patterns是无损压缩形式,因为支持信息存储在模式中。