查找最大的频繁项集

时间:2013-02-13 10:22:33

标签: data-mining

给定项集C和支持阈值m的集合,是否有一种有效的方法来生成(或者)最大的频繁模式?

通过频繁模式,我指的是项目集p,以便s中的项集C的数量,ps的子集,至少m。按照最大模式,我的意思是p中的项目数应尽可能大。

具体来说,我想避免生成所有“最大”或“封闭”模式的(组合大)集合 - 任何单个最大大小的模式都可以。

2 个答案:

答案 0 :(得分:1)

基于FP-Tree数据结构,我发现了一系列有趣的工作。该方法在一个不错的paper from 2008中进行了描述,并通过添加新的修剪技术来extended in 2011

答案 1 :(得分:1)

构建FPTree,在构建树的同时,记录最长的树路径,使得支持> = minsup。

这将为您提供最大的项目集。

如果minsup = 0,则最大的项目集是最大的事务。