查找Maximal Frequent Itemsets有什么好处

时间:2014-12-22 09:57:57

标签: data-mining

我在数据挖掘中搜索关联规则挖掘。有三种频繁项目集,

  1. 频繁项目集
  2. 关闭频繁项目集
  3. 最大频繁项目集
  4. 要生成关联规则,我们应该使用频繁项目集或关闭的频繁项目集(频繁项目集可以在封闭的频繁项目集中找到)。

    有很多算法可以找到最大频繁项集(MAFIA,Max-Miner,Depth Project,GenMax ......)

    找到最大频繁项目集有什么好处?主要想法是什么?

    感谢。

2 个答案:

答案 0 :(得分:1)

主要的想法是,在寻找具有支持的项目集时,您将最终耗尽所有内存,但频繁但不有趣,冗余和短项目集

要体验这一点,请获取一些大型真实数据并对其进行项目集挖掘;不是讲座中使用的玩具例子。

答案 1 :(得分:0)

当数据集的大小&数据集中频繁项集的数量很大,找到所有频繁项集是不可行的。在频繁项集上找到最大频繁项集(MFI)的优点是(FI),

  • 在找到所有FI之前,可以生成所有MFI。
  • 一旦我们找到最大频繁项集,我们就可以在一次扫描中生成所有频繁项集。因为频繁项集的每个子集都很频繁。