其中哪些更快,为什么?还是一样?答案是否会因任何条件(字典大小,数据类型等)而有所不同?
繁体:
for key in dict:
x = dict[key]
x = key
时髦:
for key, value in dict.items():
y = value
y = key
我没有看到完全相同的副本,但是如果有一个副本,我很乐意指出。
答案 0 :(得分:2)
事实证明实际上存在几个数量级的差异。
我对性能测试了解不多,但是我尝试做的是创建3个大小不同的dict,每个较小的dict是较大dict的子集。然后,我通过这两个功能(传统vs时髦)运行所有三个字典。然后我做了100次。
dict1,dict2和dict3的字典大小(键-值对的数量)分别为1000、50000和500000。
似乎有很大的不同,d.items()
通常更快,而d.items()
更快地 WAY 在较小的字典上。这符合期望(Python通常会奖励“ pythonic”代码)。
结果:
--d[key]--
dict1 -- mean: 0.0001113555802294286, st. dev: 1.9951038526222054e-05
dict2 -- mean: 0.01669296698019025, st. dev: 0.019088713496142
dict3 -- mean: 0.2553815016898443, st. dev: 0.02778986771642094
--d.items()--
dict1 -- mean: 6.005059978633653e-05, st. dev: 1.1960199272812617e-05
dict2 -- mean: 0.00507106617995305, st. dev: 0.009871762371401046
dict3 -- mean: 0.07369932165958744, st. dev: 0.023440325168927384
提供结果的代码(repl.it):
import timeit
import random
import statistics
def traditional(dicty):
for key in dicty:
x = dicty[key]
x = key
def hipster(dicty):
for key, value in dicty.items():
y = value
y = key
def generate_random_dicts():
random_dict1, random_dict2, random_dict3 = {}, {}, {}
for _ in range(1000):
key = generate_random_str_one_to_ten_chars()
val = generate_random_str_one_to_ten_chars()
random_dict1[key] = val
random_dict2[key] = val
random_dict3[key] = val
for _ in range(49000):
key = generate_random_str_one_to_ten_chars()
val = generate_random_str_one_to_ten_chars()
random_dict2[key] = val
random_dict3[key] = val
for _ in range(450000):
key = generate_random_str_one_to_ten_chars()
val = generate_random_str_one_to_ten_chars()
random_dict3[key] = val
return [random_dict1, random_dict2, random_dict3]
def generate_random_str_one_to_ten_chars():
ret_str = ""
for x in range(random.randrange(1,10,1)):
ret_str += chr(random.randrange(40,126,1))
return ret_str
dict1, dict2, dict3 = generate_random_dicts()
test_dicts = [dict1, dict2, dict3]
times = {}
times['traditional_times'] = {}
times['hipster_times'] = {}
for _ in range(100):
for itr, dictx in enumerate(test_dicts):
start = timeit.default_timer()
traditional(dictx)
end = timeit.default_timer()
time = end - start
try:
times['traditional_times'][f"dict{itr+1}"].append(time)
except KeyError:
times['traditional_times'][f"dict{itr+1}"] = [time]
start = timeit.default_timer()
hipster(dictx)
end = timeit.default_timer()
time = end - start
try:
times['hipster_times'][f"dict{itr+1}"].append(time)
except KeyError:
times['hipster_times'][f"dict{itr+1}"] = [time]
print("--d[key]--")
for x in times['traditional_times'].keys():
ltimes = times['traditional_times'][x]
mean = statistics.mean(ltimes)
stdev = statistics.stdev(ltimes)
print(f"{x} -- mean: {mean}, st. dev: {stdev}\n\n")
print("--d.items()--")
for x in times['hipster_times'].keys():
ltimes = times['hipster_times'][x]
mean = statistics.mean(ltimes)
stdev = statistics.stdev(ltimes)
print(f"{x} -- mean: {mean}, st. dev: {stdev}")
答案 1 :(得分:1)
此代码只需要遍历字典一次即可从中检索所有内容:
for key, value in dict.items():
此代码一次遍历整个字典,但仅检索键:
for key in dict:
x = dict[key]
然后,对于每个键,它都必须再次进入字典以查找值。因此,它必须慢一些。
尽管如此,整个事情纯粹是学术性的,在现实生活中没有任何实际意义。当您的应用程序开始运行太慢时,运行速度变慢几乎不可能是由您遍历字典的方式引起的。