绘制与熊猫和matplotlib_venn的维恩图

时间:2016-06-09 11:46:40

标签: python pandas matplotlib-venn

我想基于我的熊猫数据框绘制维恩图。我知道matplotlib_venn接受集合作为输入。我的数据集包含客户端ID和另外两列,如果客户端在广告系列中,则包含信息。

df_dataset = pd.read_csv('...path...',delimiter=',',decimal=',')
campaign_a = df_dataset[(df_dataset['CAM_A'] == 1)] 
campaign_b = df_dataset[(df_dataset['CAM_B'] == 1)]

plt.figure(figsize=(4,4))
set1 = set(campaign_a['CLI_ID'])
set2 = set(campaign_b['CLI_ID'])

venn3([set1, set2], ('Set1', 'Set2'))
plt.show()

但是我收到错误:

  

文件“C:\ Python27 \ Lib \ site-packages \ matplotlib_venn_venn3.py”,第44行,在compute_venn3_areas中       areas = np.array(np.abs(diagram_areas),float)

     

TypeError:abs()的错误操作数类型:'set'

更新

基于lanS建议,它现在有效。但由于某些原因,图表不在一起。但是在他们的文档中,相同的代码可以工作。

plt.figure(figsize=(4,4))

set1 = set(campaign_a['CLI_ID'])
set2 = set(campaign_b['CLI_ID'])
set3 = set(union['CLI_ID'])

venn3([set1, set2, set3], ('A', 'B', 'union'))
plt.show()

enter image description here

更新2 - 解决方案

最后,最简单的方法似乎只是每个空间的插入大小,而不是数据集。灵感here

3 个答案:

答案 0 :(得分:1)

我相信你需要通过3套。基于code here,如果您传递三个子集,则会将它们转换为元组,然后传递给compute_venn3_areas,其中np.abs可以处理它们。只传递2组的情况看起来像是未处理的错误。

答案 1 :(得分:0)

此错误是尝试强制2组进入venn3的结果。您需要从同一个库中导入venn2。

from matplotlib_venn import venn2

df_dataset = pd.read_csv('...path...',delimiter=',',decimal=',')
campaign_a = df_dataset[(df_dataset['CAM_A'] == 1)] 
campaign_b = df_dataset[(df_dataset['CAM_B'] == 1)]

plt.figure(figsize=(4,4))
set1 = set(campaign_a['CLI_ID'])
set2 = set(campaign_b['CLI_ID'])

venn2([set1, set2], ('Set1', 'Set2'))
plt.show()

答案 2 :(得分:0)

为少量集合创建维恩图的简单方法。希望这会有所帮助。

import matplotlib.pyplot as plt
from matplotlib_venn import venn2
from matplotlib_venn import venn3

set1 = set()
set2 = set()
set3 = set()
set4 = set()
set_array = []
set_names = ['Set1', 'Set2', 'Set3', 'Set4']

set1.add('a')
set1.add('b')

set2.add('b')
set2.add('c')

set3.add('c')
set3.add('d')

set4.add('d')
set4.add('e')

set_array.append(set1)
set_array.append(set2)
set_array.append(set3)
set_array.append(set4)

# venn2([set1, set2], ('Set1', 'Set2')) # venn2 works for two sets
venn3(set_array[0:3], set_names[0:3])   # venn3 works for three sets
plt.show()

sample output for above code