我有一个字符串数组,我需要在Golang中创建一个后缀树。 Golang中的SuffixArray不能满足我的需求,因为它只接受字节数组(即单个字符串)。 任何人都可以提供实施指针。 提前谢谢。
答案 0 :(得分:5)
以下是如何使用后缀数组执行自动完成的示例。 (playground)。
请注意,我将所有字符串加在一起,前缀为\x00
,这在字符串中不会出现。
package main
import (
"fmt"
"index/suffixarray"
"regexp"
"strings"
)
func main() {
words := []string{
"aardvark",
"happy",
"hello",
"hero",
"he",
"hotel",
}
// use \x00 to start each string
joinedStrings := "\x00" + strings.Join(words, "\x00")
sa := suffixarray.New([]byte(joinedStrings))
// User has typed in "he"
match, err := regexp.Compile("\x00he[^\x00]*")
if err != nil {
panic(err)
}
ms := sa.FindAllIndex(match, -1)
for _, m := range ms {
start, end := m[0], m[1]
fmt.Printf("match = %q\n", joinedStrings[start+1:end])
}
}
打印
match = "hello"
match = "hero"
match = "he"
答案 1 :(得分:1)
您想要的是广义后缀树。构建此类树的一种简单方法是将不同的结束标记(未在任何字符串中使用的符号)附加到每个字符串,将它们连接起来并为连接的字符串构建正常的后缀树。所以你只需要添加" hello world"到字符串集并使用:
match, err := regexp.Compile("[^\x00]*wor[^\x00]*")
让字符串包含" wor"。请注意,正确的字符串为joinedStrings[start:end]
。
答案 2 :(得分:0)
我创建了具有O(n)复杂度的后缀树实现,其中n是字符串的长度:https://github.com/twelvedata/searchindex
我在中等https://medium.com/twelve-data/in-memory-text-search-index-for-quotes-on-go-5243adc62c26上的文章中有更多详细信息