Python:从“元组列表”生成一组“元组”,不考虑顺序

时间:2015-12-02 20:17:25

标签: python list tuples

如果我有以下元组列表:

select * from table1 where header_id in 
(select b.header_id from table2 b where event_id in 
(select d.accounting_event_id from table3 d where d.invoice_id=1234 
union select aida.bc_event_id from table3 aida where ida.invoice_id=1234 
union select d.accounting_event_id from table4 d where d.invoice_id=1234
union select d.accounting_event_id from table5 d where d.check_id in (select a.check_id from table4 a where a.invoice_id=1234)
 union select d.accounting_event_id from table6 d where d.invoice_id=1234))

我想删除重复的元组(根据内容和内部项目的顺序重复),以便输出为:

[('a', 'b'), ('c', 'd'), ('a', 'b'), ('b', 'a')]

或者

[('a', 'b'), ('c', 'd')]

我尝试将其转换为设置然后再列出,但输出会在结果集中同时保留[('b', 'a'), ('c', 'd')] ('b', 'a')

4 个答案:

答案 0 :(得分:6)

如果您不介意使用带有集合的冻结集:

l = [('a', 'b'), ('c', 'd'), ('a', 'b'), ('b', 'a')]

print(set(map(frozenset,l)))
{frozenset({'a', 'b'}), frozenset({'c', 'd'})}

如果愿意,您可以转换回元组:

l = [('a', 'b'), ('c', 'd'), ('a', 'b'), ('b', 'a')]

print(list(map(tuple,set(map(frozenset ,l)))))
[('a', 'b'), ('d', 'c')]

或使用一组并反转元组的顺序:

l = [('a', 'b'), ('c', 'd'), ('a', 'b'), ('b', 'a')]

seen, pairs = set(), []
for a,b in l:
    if (a,b) not in seen and (b,a) not in seen:
        pairs.append((a,b))
    seen.add((a,b))

答案 1 :(得分:4)

如果订单不重要,这可以解决您的问题。

a=[('a', 'b'), ('c', 'd'), ('a', 'b'), ('b', 'a')]


a=map(tuple,[sorted(i) for i in a])

print list(set(a))

输出:

[('a', 'b'), ('c', 'd')]

答案 2 :(得分:1)

试试这个:

a = [('a', 'b'), ('c', 'd'), ('a', 'b'), ('b', 'a')]
b = list(set([ tuple(sorted(t)) for t in a ]))
[('a', 'b'), ('c', 'd')]

让我们分解一下:

如果对元组进行排序,它将成为一个排序列表。

>>> t = ('b', 'a')
>>> sorted(t)
['a', 'b']

对于t中的每个元组a,对其进行排序并将其转换回元组。

>>> b = [ tuple(sorted(t)) for t in a ]
>>> b
[('a', 'b'), ('c', 'd'), ('a', 'b'), ('a', 'b')]

将结果列表b转换为集:值现在是唯一的。将其转换回列表。

>>> list(set(b))
[('a', 'b'), ('c', 'd')]

Etvoilà!

请注意,您可以使用generator而不是list comprehension跳过创建中间列表b

>>> list(set(tuple(sorted(t)) for t in a))
[('a', 'b'), ('c', 'd')]

答案 3 :(得分:-1)

拯救的内置类型:

data = [('a', 'b'), ('c', 'd'), ('a', 'b'), ('b', 'a')]
set(map(frozenset, data))
{frozenset({'a', 'b'}), frozenset({'c', 'd'})}