所以我有一长串字符例如 - " wdllwdwwwlldd" 该字符串只包含相同的字符-wld(尝试并猜测我正在做什么;)
字符串很长,大约420个字符。
我想找到,如果它们存在,字符串中的任何模式。 例如,如果字符串是 - " wllddwllddwlldd" 然后它" wlldd"将是找到的模式。
所以我想在字符串中找到任何重复的序列。
经过一些研究,后缀树和后缀数组似乎在这些问题上得到了很多提及。
是否正确或有其他方法可以做到这一点吗?
我可以说这是一项相当大的任务,可能需要很长时间。
提前致谢。
答案 0 :(得分:0)
所以你想要的是从某些字符串中提取所有出现的某些模式,我明白了吗?如果是这样,我们讨论了非常类似的事情in this thread。它应该至少让你朝着正确的方向前进。
在您的情况下,使用w+l+d+
这样的正则表达式应该可以解决问题。
修改强>
问题澄清了一点......所以你正在寻找的算法详见 this post