在拼写错误检测任务中,我使用Python 3.5使用marisa_tries数据结构作为我的词典。
简短的问题
如何在marisa_trie
中添加元素?
上下文
这个想法是:如果一个单词在我的词典中,那么它是正确的。现在,如果它不在我的词典中,那可能是不正确的。但是我计算了整个文档中单词的频率,如果单词频率足够高,我想保存这个单词,考虑到它的频繁,所以可能是正确的。
在这种情况下,如何将这个新单词添加到我的marisa_trie.Trie
词典中? (不必每次都建立一个新的特里)?
谢谢:)
答案 0 :(得分:4)
marisa_trie.Trie
实现了一个不可变的特里,所以你的问题的答案是:它是不可能的。
你可能想尝试一个名为datrie
的类似Python包,它支持修改和相对快速的查询(PyPI页面列出了针对内置dict
的一些基准)。