给定项集C
和支持阈值m
的集合,是否有一种有效的方法来生成(或者)最大的频繁模式?
通过频繁模式,我指的是项目集p
,以便s
中的项集C
的数量,p
是s
的子集,至少m
。按照最大模式,我的意思是p
中的项目数应尽可能大。
具体来说,我想避免生成所有“最大”或“封闭”模式的(组合大)集合 - 任何单个最大大小的模式都可以。
答案 0 :(得分:1)
基于FP-Tree数据结构,我发现了一系列有趣的工作。该方法在一个不错的paper from 2008中进行了描述,并通过添加新的修剪技术来extended in 2011。
答案 1 :(得分:1)
构建FPTree,在构建树的同时,记录最长的树路径,使得支持> = minsup。
这将为您提供最大的项目集。
如果minsup = 0,则最大的项目集是最大的事务。