我在python中使用trie-trees实现了自动完成程序的变体,并匹配了Ubuntu标准字典中的单词。根据我的理解,树木是最快的,但我发现它们占据了相当大的空间。
我希望将其推向移动设备,但我非常关注内存限制。我的问题是:什么是存储全英文字典内容的最有效方法,并确保条目的最佳查询时间,因为这个结构将被大量查询/利用?
答案 0 :(得分:1)
存储词典的一种非常有效的方法是Directed Acyclic Word Graph(DAWG)。
以下是一些链接:
然后有一个名为Ternary search tries的Trie变量,这是非常有效的内存并具有快速查找速度