我有一个表单列表:
testdata = [['9034968', 'ETH'], ['14160113', 'ETH'], ['9034968', 'ETH'],
['11111', 'NOT'], ['9555269', 'NOT'], ['15724032', 'ETH'],
['15481740', 'ETH'], ['15481757', 'ETH'], ['15481724', 'ETH'],
['10307528', 'ETH'], ['15481757', 'ETH'], ['15481724', 'ETH'],
['15481740', 'ETH'], ['15379365', 'ETH'], ['11111', 'NOT'],
['9555269', 'NOT'], ['15379365', 'ETH']]
我希望得到一个最终结果,将唯一名称与其值组合在一起。 所以在finall列表(或dictinary,或任何iterable)中只有两个名称(ETH和NOT) 将列表作为所有其他值的第二项,例如:
In [252]: unique_names
Out[252]:
{'ETH': ['9034968',
'14160113',
'9034968',
'15724032',
'15481740',
'15481757',
'15481724',
'10307528',
'15481757',
'15481724',
'15481740',
'15379365',
'15379365'],
'NOT': ['11111', '9555269', '11111', '9555269']}
为实现这一目标,我使用了字典并执行了以下步骤:
unique_names = []
for (x,y) in testdata:
if y not in unique_names:
unique_names.append(y)
# now unique_names is ['ETH', 'NOT']
unique_names = {name:list() for name in unique_names}
for (x,y) in testdata: unique_names[y]=unique_names[y]+[x]
#so finally I get the result above
我的问题是:
test_data
是包含1000个条目的SQL查询的结果。我的解决方案运行速度很慢(至少感觉如何)。 此问题的示例数据来自关于集合和列表的类似问题:Python: Uniqueness for list of lists。不幸的是,OP需要不同的结果,但数据结构足够合适。
答案 0 :(得分:3)
您可以像这样使用defaultdict
from collections import defaultdict
d = defaultdict(list)
for (value, key) in testdata:
d[key].append(value)
print d
或使用普通字典
d = {}
for (value, key) in testdata:
d.setdefault(key, []).append(value)
print d
两个例子都是基于相同的想法。它们将值组合为基于键的列表。如果密钥不存在于字典中,dict.setdefault
将为密钥分配默认值,然后返回该值。我们只是将值附加到与密钥对应的列表中。