广义序列模式算法MapReduce

时间:2011-01-19 21:52:02

标签: java python mapreduce gsp graph-algorithm

我正在寻找广义时序模式算法(GSP)的示例实现http://en.wikipedia.org/wiki/GSP_Algorithm

虽然维基百科文章提供了伪代码,但它有点令人困惑,我希望看到一些正确的代码(理想情况下是python或java)。有谁知道一个很好的参考?

我想先了解算法,然后才能使它在MapReduce世界中运行 - 正如维基百科文章所示,我认为计数器的使用可能很复杂。

我这样做是因为我有一个事件图表,其中边缘受时间约束,一个序列将是一个节点连接到另一个节点的地方,其中A - > B在开始和结束时间之间发生并且B - > C在第一次连接完成B后发生X次。 A - > B - > C将是序列,序列不能多次重新访问节点。

2 个答案:

答案 0 :(得分:1)

如果您想要 GSP,PrefixSpan,SPADE,SPAM 等许多Java代码,请访问以下网站:http://www.philippe-fournier-viger.com/spmf/

然后你可以检查一下你是否可以将它们改编成map-reduce算法。

答案 1 :(得分:1)

SPMF是一个很好的工具,可以实现许多算法。 它可以帮助我们节省大量时间。 但我们需要比较不同算法的性能,如广义序列模式(GSP),这是序列模式挖掘中的一种重要算法。