我需要使用模式搜索大量的单词。模式可以包含字母序列和通配符*,它们可以表示每个字母(或其中一些字母)。模式代表整个单词或单词。我发现我使用了后缀树。但是我需要有效的方法将这棵树存储在磁盘上,因为它需要大量的RAM。有没有有效的方法来搜索存储在驱动器上的单词列表?它也应该是一个在线算法(我的意思是我可以在树上添加新单词) 谢谢!
答案 0 :(得分:0)
您可以尝试aho-corasick算法。它是最快的多模式搜索算法。您还可以使用通配符。您可以在PHP @ https://phpahocorasick.codeplex.com中尝试我的实现。