使用Pandas交叉表与seaborn堆积的条形图

时间:2017-04-21 14:00:18

标签: python pandas matplotlib seaborn

我正在尝试用我的数据帧在seaborn中创建一个堆积的条形图。

我首先在pandas中生成一个交叉表,如下所示:

pd.crosstab(df['Period'], df['Mark'])

返回:

  Mark            False  True  
Period BASELINE    583    132
       WEEK 12     721      0 
       WEEK 24     589    132 
       WEEK 4      721      0

我想用seaborn创建一个堆积的条形图用于同余,这就是我用于其余图形的内容。我一直在努力做到这一点,因为我无法索引交叉表。

我已经能够使用.plot.barh(stacked=True)在熊猫中制作我想要的情节,但是没有运气与seaborn。我有什么想法可以做到这一点吗?

由于

2 个答案:

答案 0 :(得分:16)

正如您所说,您可以使用pandas来创建堆积条形图。你希望拥有“seaborn plot”的论点是无关紧要的,因为每个seaborn图和每个pandas图最终只是matplotlib对象,因为两个库的绘图工具都只是matplotlib包装器。

所以这是一个完整的解决方案(从@ andrew_reece的答案中获取数据)。

import numpy as np 
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

n = 500
mark = np.random.choice([True,False], n)
periods = np.random.choice(['BASELINE','WEEK 12', 'WEEK 24', 'WEEK 4'], n)

df = pd.DataFrame({'mark':mark,'period':periods})
ct = pd.crosstab(df.period, df.mark)

ct.plot.bar(stacked=True)
plt.legend(title='mark')

plt.show()

enter image description here

答案 1 :(得分:3)

创建Seaborn doesn't like stacked bar charts的人(但该链接有一个使用Seaborn + Matplotlib来制作它们的黑客)。

如果您愿意接受分组条形图而不是堆叠条形图,这是一种方法:

 # first some sample data
 import numpy as np 
 import pandas as pd
 import seaborn as sns

 N = 1000
 mark = np.random.choice([True,False], N)
 periods = np.random.choice(['BASELINE','WEEK 12', 'WEEK 24', 'WEEK 4'], N)

 df = pd.DataFrame({'mark':mark,'period':periods})
 ct = pd.crosstab(df.period, df.mark)

 mark      False  True 
 period                
 BASELINE    118    111
 WEEK 12     117    149
 WEEK 24     117    130
 WEEK 4      127    131

 # now stack and reset
 stacked = ct.stack().reset_index().rename(columns={0:'value'})

 # plot grouped bar chart
 sns.barplot(x=stacked.period, y=stacked.value, hue=stacked.mark)

grouped bar chart