从Python列表中创建集合

时间:2014-06-25 11:41:31

标签: python list set

我有一个表单列表:

testdata = [['9034968', 'ETH'],  ['14160113', 'ETH'],  ['9034968', 'ETH'],  
            ['11111', 'NOT'], ['9555269', 'NOT'],  ['15724032', 'ETH'],  
            ['15481740', 'ETH'],  ['15481757', 'ETH'],  ['15481724', 'ETH'],   
            ['10307528', 'ETH'],  ['15481757', 'ETH'],  ['15481724', 'ETH'],
            ['15481740', 'ETH'],  ['15379365', 'ETH'],  ['11111', 'NOT'],
            ['9555269', 'NOT'],  ['15379365', 'ETH']]

我希望得到一个最终结果,将唯一名称与其值组合在一起。 所以在finall列表(或dictinary,或任何iterable)中只有两个名称(ETH和NOT) 将列表作为所有其他值的第二项,例如:

In [252]: unique_names
Out[252]: 
{'ETH': ['9034968',
  '14160113',
  '9034968',
  '15724032',
  '15481740',
  '15481757',
  '15481724',
  '10307528',
  '15481757',
  '15481724',
  '15481740',
  '15379365',
  '15379365'],
 'NOT': ['11111', '9555269', '11111', '9555269']}

为实现这一目标,我使用了字典并执行了以下步骤:

unique_names = []

for (x,y) in testdata: 
    if y not in unique_names:
       unique_names.append(y)

# now unique_names is ['ETH', 'NOT']

unique_names = {name:list() for name in unique_names}

for (x,y) in testdata: unique_names[y]=unique_names[y]+[x]

#so finally I get the result above

我的问题是:

  • test_data是包含1000个条目的SQL查询的结果。我的解决方案运行速度很慢(至少感觉如何)。
  • 你能用更多的Pythonic方式吗?

此问题的示例数据来自关于集合和列表的类似问题:Python: Uniqueness for list of lists。不幸的是,OP需要不同的结果,但数据结构足够合适。

1 个答案:

答案 0 :(得分:3)

您可以像这样使用defaultdict

from collections import defaultdict
d = defaultdict(list)

for (value, key) in testdata:
    d[key].append(value)

print d

或使用普通字典

d = {}
for (value, key) in testdata:
    d.setdefault(key, []).append(value)
print d

两个例子都是基于相同的想法。它们将值组合为基于键的列表。如果密钥不存在于字典中,dict.setdefault将为密钥分配默认值,然后返回该值。我们只是将值附加到与密钥对应的列表中。