如何使用mahout形成频繁项目集的规则

时间:2012-07-17 07:56:57

标签: data-mining mahout

我正在学习mahout中的fpgrowth,我发现出生频繁项目集的功能,但是如何使用mahout形成频繁项目集的规则?它还没有在mahout中实现吗?

2 个答案:

答案 0 :(得分:0)

从频繁模式中计算规则相当容易,并且可能不会从并行性和分布式中获益。毕竟,您可以从数据中获得更少数量的频繁模式。

因此,在Mahout之外执行此操作可能要快得多,具体取决于您拥有的频繁模式的数量。

答案 1 :(得分:0)

Mahout不专门用于模式挖掘。

您可以查看SPMF软件:http://www.philippe-fournier-viger.com/spmf/index.php(我是作者)。

它包含超过45种与频繁项集和关联规则挖掘相关的算法的Java源代码。

它包括一些经典算法的算法,如FPGrowth。但是它还提供了一些您在其他数据挖掘工具中找不到的专用算法,例如挖掘稀有项集,可擦除项集,高效用项集,来自不确定数据的项集等等。

例如,您可以在“经典”关联规则旁边尝试许多不同类型的关联规则,例如:关联关联规则,关联规则的信息和通用基础,顺序规则等等。

它是根据GPL许可的,并且有一些简单的GUI界面可用于一些最流行的算法,如果您有任何疑问,可以在论坛中发帖,我会尽力回答您。