我正在寻找具有以下功能的广义后缀树(GST)的Java实现:
从1000个字符串创建GST后,我想知道这1000个字符串中有多少包含其他字符串'。
搜索必须保持安静,因为我需要对大约100'000个平均长度为10的候选字符串应用搜索。
答案 0 :(得分:4)
试试The Semantic Discovery Toolkit。它在text / src / java / org / sd / text / radixtree
上有一个实现答案 1 :(得分:3)
非常规后缀树的Java实现位于:http://illya-keeplearning.blogspot.com/2009/04/suffix-trees-java-ukkonens-algorithm.html
答案 2 :(得分:3)
我在Java中创建了一个后缀树,允许您轻松添加自己的搜索功能和其他匹配算法。我的博客文章Suffix Trees in Java概述了下载最新版本的说明。我的Java实现基于Mark Nelson的Fast String Searching With Suffix Trees文章。
更新2016-06-18
答案 3 :(得分:2)
您可以在此处找到Generalized Suffix Tree in Java的实施。 我试图尽可能多地记录它,所以你可能会发现它很有用。
答案 4 :(得分:0)
这是我对SuffixTree的实现: https://github.com/losvald/sglj/blob/master/src/main/java/org/sglj/util/PATTrie.java
除其他外,它支持在节点中存储任意数据,并查找与前缀相关联的值集。