维恩图最多4个列表 - 输出交叉点和唯一集

时间:2010-02-11 10:11:00

标签: python list venn-diagram

在我的作品中我使用了很多维恩图,到目前为止,我一直依赖基于网络的“Venny”。这提供了导出各种交叉点(即,仅属于该特定交叉点的元素)的不错选项。此外,它最多可以绘制4个列表。

问题是,使用大型列表(4K +元素)和超过3组这样做是一件苦差事(复制,粘贴,保存......)。因此,我决定专注于自己生成列表并将其用于绘图。

这篇冗长的介绍导致了问题的关键。给定3或4个部分包含相同元素的列表,如何在Python中处理它们以获得各种集合(唯一的,共同的4,常见于第一和第二等等),如维恩图所示({ {3}},3 list graphical example)?对于3个列表来说看起来并不太难,但对于4个列表来说它有点复杂。

1 个答案:

答案 0 :(得分:6)

假设您有python 2.6或更高版本:

>>> from itertools import combinations
>>>
>>> data = dict(
...   list1 = set(list("alphabet")),
...   list2 = set(list("fiddlesticks")),
...   list3 = set(list("geography")),
...   list4 = set(list("bovinespongiformencephalopathy")),
... )
>>>
>>> variations = {}
>>> for i in range(len(data)):
...   for v in combinations(data.keys(),i+1):
...     vsets = [ data[x] for x in v ]
...     variations[tuple(sorted(v))] = reduce(lambda x,y: x.intersection(y), vsets)
...
>>> for k,v in sorted(variations.items(),key=lambda x: (len(x[0]),x[0])):
...   print "%r\n\t%r" % (k,v)
...
('list1',)
        set(['a', 'b', 'e', 'h', 'l', 'p', 't'])
('list2',)
        set(['c', 'e', 'd', 'f', 'i', 'k', 'l', 's', 't'])
('list3',)
        set(['a', 'e', 'g', 'h', 'o', 'p', 'r', 'y'])
('list4',)
        set(['a', 'c', 'b', 'e', 'g', 'f', 'i', 'h', 'm', 'l', 'o', 'n', 'p', 's', 'r', 't', 'v', 'y'])
('list1', 'list2')
        set(['e', 'l', 't'])
('list1', 'list3')
        set(['a', 'h', 'e', 'p'])
('list1', 'list4')
        set(['a', 'b', 'e', 'h', 'l', 'p', 't'])
('list2', 'list3')
        set(['e'])
('list2', 'list4')
        set(['c', 'e', 'f', 'i', 'l', 's', 't'])
('list3', 'list4')
        set(['a', 'e', 'g', 'h', 'o', 'p', 'r', 'y'])
('list1', 'list2', 'list3')
        set(['e'])
('list1', 'list2', 'list4')
        set(['e', 'l', 't'])
('list1', 'list3', 'list4')
        set(['a', 'h', 'e', 'p'])
('list2', 'list3', 'list4')
        set(['e'])
('list1', 'list2', 'list3', 'list4')
        set(['e'])