如果我有以下元组列表:
select * from table1 where header_id in
(select b.header_id from table2 b where event_id in
(select d.accounting_event_id from table3 d where d.invoice_id=1234
union select aida.bc_event_id from table3 aida where ida.invoice_id=1234
union select d.accounting_event_id from table4 d where d.invoice_id=1234
union select d.accounting_event_id from table5 d where d.check_id in (select a.check_id from table4 a where a.invoice_id=1234)
union select d.accounting_event_id from table6 d where d.invoice_id=1234))
我想删除重复的元组(根据内容和内部项目的顺序重复),以便输出为:
[('a', 'b'), ('c', 'd'), ('a', 'b'), ('b', 'a')]
或者
[('a', 'b'), ('c', 'd')]
我尝试将其转换为设置然后再列出,但输出会在结果集中同时保留[('b', 'a'), ('c', 'd')]
和('b', 'a')
!
答案 0 :(得分:6)
如果您不介意使用带有集合的冻结集:
l = [('a', 'b'), ('c', 'd'), ('a', 'b'), ('b', 'a')]
print(set(map(frozenset,l)))
{frozenset({'a', 'b'}), frozenset({'c', 'd'})}
如果愿意,您可以转换回元组:
l = [('a', 'b'), ('c', 'd'), ('a', 'b'), ('b', 'a')]
print(list(map(tuple,set(map(frozenset ,l)))))
[('a', 'b'), ('d', 'c')]
或使用一组并反转元组的顺序:
l = [('a', 'b'), ('c', 'd'), ('a', 'b'), ('b', 'a')]
seen, pairs = set(), []
for a,b in l:
if (a,b) not in seen and (b,a) not in seen:
pairs.append((a,b))
seen.add((a,b))
答案 1 :(得分:4)
如果订单不重要,这可以解决您的问题。
a=[('a', 'b'), ('c', 'd'), ('a', 'b'), ('b', 'a')]
a=map(tuple,[sorted(i) for i in a])
print list(set(a))
输出:
[('a', 'b'), ('c', 'd')]
答案 2 :(得分:1)
试试这个:
a = [('a', 'b'), ('c', 'd'), ('a', 'b'), ('b', 'a')]
b = list(set([ tuple(sorted(t)) for t in a ]))
[('a', 'b'), ('c', 'd')]
让我们分解一下:
如果对元组进行排序,它将成为一个排序列表。
>>> t = ('b', 'a')
>>> sorted(t)
['a', 'b']
对于t
中的每个元组a
,对其进行排序并将其转换回元组。
>>> b = [ tuple(sorted(t)) for t in a ]
>>> b
[('a', 'b'), ('c', 'd'), ('a', 'b'), ('a', 'b')]
将结果列表b
转换为集:值现在是唯一的。将其转换回列表。
>>> list(set(b))
[('a', 'b'), ('c', 'd')]
Etvoilà!
请注意,您可以使用generator而不是list comprehension跳过创建中间列表b
。
>>> list(set(tuple(sorted(t)) for t in a))
[('a', 'b'), ('c', 'd')]
答案 3 :(得分:-1)
拯救的内置类型:
data = [('a', 'b'), ('c', 'd'), ('a', 'b'), ('b', 'a')]
set(map(frozenset, data))
{frozenset({'a', 'b'}), frozenset({'c', 'd'})}