我有一个超过1000个密钥的庞大词典,每个值超过600 000 int long。现在,我需要提取一些这些整数,所以从60万我想去说5k。但它不能随机5k,它们必须处于非常具体的位置。由于5k仍然有点太大而无法手工提取,我需要使用一个索引列表来指示值中应该取出哪些整数。 我测试了小列表上的提取,索引[1,3,5,7,9]和long_val ['a','b','c','d','e','f','g ','h','i','j','k']然后我可以这样做:
for each in xrange(len(long_val)):
print indices[long_val[each]]
我得到b,d,f,h和j(根据需要)。
现在,处理字典(其中long_val被实际字典值替换)并不那么简单。我试过了:
for keys,values in dict_gtps.iteritems():
for each in xrange(len(values)):
abs_new[keys]=pos_3[values[each]]
但我收到“Index out of range”错误消息。
答案 0 :(得分:5)
如果使用相同的索引,使用itemgetter(*indices)
>>> from operator import itemgetter
>>> indices = [1,3,5,7,9]
>>> long_val = ['a','b','c','d','e','f','g','h','i','j','k']
>>> ig = itemgetter(*indices)
>>> ig(long_val)
('b', 'd', 'f', 'h', 'j')
所以
from operator import itemgetter
ig = itemgetter(*indices)
for k, v in dict_gtps.iteritems():
print ig(v)
abs_new[k] = ig(v)
你也可以使用词典理解
abs_new = {k:ig(v) for k,v in dict_gtps.iteritems()}
答案 1 :(得分:3)
假设我正确阅读了您的要求,您可以尝试:
for key, value in dict_gtps.iteritems():
abs_new[key] = [value[i] for i in indices]
答案 2 :(得分:1)
您的示例代码存在缺陷,indices和long_val的值相反。
indices = [1,3,5,7,9]
long_val = ['a','b','c','d','e','f','g','h','i','j','k']
for each in xrange(len(long_val)):
print indices[long_val[each]]
抛出TypeError
。它应该是:
indices = [1,3,5,7,9]
long_val = ['a','b','c','d','e','f','g','h','i','j','k']
for each in xrange(len(indices)):
print long_val[indices[each]]
基于此,很明显为什么你的字典函数抛出一个范围错误,你输入错误的变量。我会让你自己尝试修复代码。
/编辑后代 此外,由于索引中的值是整数,因此您实际上不需要使用xrange -
for i in indices:
print long_val[i]
更简单。