我正在学习mahout中的fpgrowth,我发现出生频繁项目集的功能,但是如何使用mahout形成频繁项目集的规则?它还没有在mahout中实现吗?
答案 0 :(得分:0)
从频繁模式中计算规则相当容易,并且可能不会从并行性和分布式中获益。毕竟,您可以从数据中获得更少数量的频繁模式。
因此,在Mahout之外执行此操作可能要快得多,具体取决于您拥有的频繁模式的数量。
答案 1 :(得分:0)
Mahout不专门用于模式挖掘。
您可以查看SPMF软件:http://www.philippe-fournier-viger.com/spmf/index.php(我是作者)。
它包含超过45种与频繁项集和关联规则挖掘相关的算法的Java源代码。
它包括一些经典算法的算法,如FPGrowth。但是它还提供了一些您在其他数据挖掘工具中找不到的专用算法,例如挖掘稀有项集,可擦除项集,高效用项集,来自不确定数据的项集等等。
例如,您可以在“经典”关联规则旁边尝试许多不同类型的关联规则,例如:关联关联规则,关联规则的信息和通用基础,顺序规则等等。
它是根据GPL许可的,并且有一些简单的GUI界面可用于一些最流行的算法,如果您有任何疑问,可以在论坛中发帖,我会尽力回答您。