将元素添加到Marisa Trie中

时间:2016-05-17 09:49:29

标签: python spell-checking trie spelling

在拼写错误检测任务中,我使用Python 3.5使用marisa_tries数据结构作为我的词典。

简短的问题
如何在marisa_trie中添加元素?

上下文
这个想法是:如果一个单词在我的词典中,那么它是正确的。现在,如果它不在我的词典中,那可能是不正确的。但是我计算了整个文档中单词的频率,如果单词频率足够高,我想保存这个单词,考虑到它的频繁,所以可能是正确的。 在这种情况下,如何将这个新单词添加到我的marisa_trie.Trie词典中? (不必每次都建立一个新的特里)?

谢谢:)

1 个答案:

答案 0 :(得分:4)

marisa_trie.Trie实现了一个不可变的特里,所以你的问题的答案是:它是不可能的。

你可能想尝试一个名为datrie的类似Python包,它支持修改和相对快速的查询(PyPI页面列出了针对内置dict的一些基准)。