在列表中的所有项目上传递函数的最快方法

时间:2016-05-15 15:03:19

标签: python python-3.x dictionary

我有一个大约50,000个单词的列表,我想在列表中的每个项目上传递一个函数。然后我想将原始单词保存为键,将翻译后的单词保存为字典中的相应值。现在我知道我可以这样做:

translations = {word: translate(word) for word in word_list}

但我认为这需要太长时间。有没有更快的方法可以实现?

2 个答案:

答案 0 :(得分:0)

映射函数应该比dict理解更快:

translations = dict(zip(word_list, map(translate, word_list)))

这里发生的是:

  • 我们将该函数应用于word_list中的每个元素,并返回map对象
  • 将其合并为原始列表和该地图对象中一对一元素元组的序列(zip对象)
  • 将生成的序列转换为字典

设置测试程序后,似乎性能略有改善。这是代码:

from datetime import datetime
def translate(wo):
    return wo.upper()

word_list = {str(i):str(i+1) for i in range(50000)}
d = datetime.now()
translations = dict(zip(word_list, map(translate, word_list)))
print(datetime.now() - d)
d = datetime.now()
translations = {word: translate(word) for word in word_list}
print(datetime.now() - d)

经过几次运行后,第二次打印时间总是大于第一次打印时间,这证明了效率。

答案 1 :(得分:0)

如果您只需要很少的值,并且不会遍历dict,那么您可以尝试懒散地进行:

class MyDefaultDict(dict):
    def __init__(self, word_iterable, translate):
        self.word_set = frozenset(word_iterable)
        self.translate = translate
    def __missing__(self, key):
        if key in self.word_set:
            translated = translate(key)
            self[key] = translated
            return translated
        raise KeyError(key)