python:使用通配符快速字典单词查找*

时间:2011-10-03 16:26:49

标签: python dictionary tree lookup

鉴于文本被分成单词列表,我想查找单词词典中的每个单词,这些单词也可以从文本文件和split('\n')中读取。

我不需要检查字典中是否包含每个单词(速度非常慢),而是需要根据通配符选择元素列表*('*'在最后,即不需要permuterm解决方案)。例如,解决方案应该选择以'dep'开头的所有字典元素,而不遍历整个字典列表。

在这种情况下,性能至关重要。我虽然是Btree ......但是

  1. 在Python中快速实现的最佳包和数据类型是什么。
  2. 请提供代码示例

2 个答案:

答案 0 :(得分:2)

你想要一个特里。使用PyTrie包。

答案 1 :(得分:2)

使用dawg,就空间浪费而言,效率高于Trie。有一些python实现,但首先看看here