查找长字符串是否包含任何模式

时间:2015-08-29 21:35:59

标签: java string sequence

所以我有一长串字符例如 - " wdllwdwwwlldd" 该字符串只包含相同的字符-wld(尝试并猜测我正在做什么;)

字符串很长,大约420个字符。

我想找到,如果它们存在,字符串中的任何模式。 例如,如果字符串是 - " wllddwllddwlldd" 然后它" wlldd"将是找到的模式。

所以我想在字符串中找到任何重复的序列。

经过一些研究,后缀树和后缀数组似乎在这些问题上得到了很多提及。

是否正确或有其他方法可以做到这一点吗?

我可以说这是一项相当大的任务,可能需要很长时间。

提前致谢。

1 个答案:

答案 0 :(得分:0)

所以你想要的是从某些字符串中提取所有出现的某些模式,我明白了吗?如果是这样,我们讨论了非常类似的事情in this thread。它应该至少让你朝着正确的方向前进。

在您的情况下,使用w+l+d+这样的正则表达式应该可以解决问题。

修改

问题澄清了一点......所以你正在寻找的算法详见 this post