字符串/序列模式挖掘

时间:2010-10-17 13:19:55

标签: java string sequence

这是一个星期,我正试图找到我的问题的答案,如果有人可以提供帮助,我将不胜感激。 我有一个字符串列表(最初的序列列表,可以看作字符串列表),我想找到一个模式(这是一个字符串本身)与该列表的字符串,是否有任何Java库我可以使用或者是否有任何工具(如weka,它不会这样做!)可以帮助我吗?

2 个答案:

答案 0 :(得分:2)

听起来你想要找到这些字符串的longest common subsequence。这是众所周知的算法问题,通常使用动态编程来解决。有关多种语言的各种实现,请参阅here

答案 1 :(得分:0)

如果要查找在一组序列中经常出现的模式,则可以尝试“顺序模式挖掘”或“顺序规则挖掘算法”。

我的SPMF Java open-source data mining library中有几种这些算法的实现。