FP增长算法用于项集挖掘。有没有一种方法可以将这些算法用于顺序模式挖掘而不是项目集挖掘?
答案 0 :(得分:0)
FPGrowth算法被定义为用于事务查找项目集。因此,它并不关心项目的顺序,并且每个项目在交易中只能出现一次。
如果要将其应用于序列以查找顺序模式,则这是一个更普遍的问题。换句话说,项集挖掘是顺序模式挖掘的特例。要解决此问题,您需要概括FPGrowth。首先,您将需要修改FPTree来存储序列,其中项目可以多次出现。这意味着更改树的分支的创建方式。但是,您还需要更改表示节点的项目之间的链接的处理方式,因为同一项目在每个序列中可能出现多次。
但这真的是个好主意吗?我不确定。有许多顺序模式挖掘算法。例如,您可以在Java中嵌入的SPMF数据挖掘库(http://www.philippe-fournier-viger.com/spmf/)中使用几种实现,因此您无需自己实现。