我在数据挖掘中搜索关联规则挖掘。有三种频繁项目集,
要生成关联规则,我们应该使用频繁项目集或关闭的频繁项目集(频繁项目集可以在封闭的频繁项目集中找到)。
有很多算法可以找到最大频繁项集(MAFIA,Max-Miner,Depth Project,GenMax ......)
找到最大频繁项目集有什么好处?主要想法是什么?
感谢。
答案 0 :(得分:1)
主要的想法是,在寻找具有低支持的长项目集时,您将最终耗尽所有内存,但频繁但不有趣,冗余和短项目集
要体验这一点,请获取一些大型真实数据并对其进行项目集挖掘;不是讲座中使用的玩具例子。
答案 1 :(得分:0)
当数据集的大小&数据集中频繁项集的数量很大,找到所有频繁项集是不可行的。在频繁项集上找到最大频繁项集(MFI)的优点是(FI),