我正在寻找广义时序模式算法(GSP)的示例实现http://en.wikipedia.org/wiki/GSP_Algorithm
虽然维基百科文章提供了伪代码,但它有点令人困惑,我希望看到一些正确的代码(理想情况下是python或java)。有谁知道一个很好的参考?
我想先了解算法,然后才能使它在MapReduce世界中运行 - 正如维基百科文章所示,我认为计数器的使用可能很复杂。
我这样做是因为我有一个事件图表,其中边缘受时间约束,一个序列将是一个节点连接到另一个节点的地方,其中A - > B在开始和结束时间之间发生并且B - > C在第一次连接完成B后发生X次。 A - > B - > C将是序列,序列不能多次重新访问节点。
答案 0 :(得分:1)
如果您想要 GSP,PrefixSpan,SPADE,SPAM 等许多Java代码,请访问以下网站:http://www.philippe-fournier-viger.com/spmf/
然后你可以检查一下你是否可以将它们改编成map-reduce算法。
答案 1 :(得分:1)
SPMF是一个很好的工具,可以实现许多算法。 它可以帮助我们节省大量时间。 但我们需要比较不同算法的性能,如广义序列模式(GSP),这是序列模式挖掘中的一种重要算法。