Question

我有一个包含大量单词（100.000+）的uniqueWordList。每一个单词的卦都在all allTriGrams中。

我想构建一个包含所有唯一三元组作为键的字典以及那些三元组可以作为值匹配的所有单词。

示例：

epicDict = {‘ban’:[‘banana’,’banned’],’nan’:[‘banana’]}

到目前为止我的代码：

for value in allTriGrams:   
    for word in uniqueWordList:
        if value in word:
            epicDict.setdefault(value,[]).append(word)

我的问题：这种方法需要很多时间。有没有办法加快这个过程？

Answer 1

如果uniqueWordList是一个集合，那么你可以改为：

if value in uniqueWordList:
    epicDict.setdefault(value,[]).append(word)

Answer 2

在简单解决方案中，我希望这会更快：

{{1}}