我正在尝试使用Python中的Seaborn包来可视化一些数据。特别是,我想使用catplot(kind='bar')
函数(以前称为factorplot()
)。我的DataFrame看起来像这样(列'x'
,'col'
,'row'
和'hue'
是分类的):
x y dy col row hue
0 4 9 0.766591 1 0 2
1 5 9 0.688683 0 1 0
2 0 7 0.707982 0 0 1
3 3 6 0.767210 2 1 0
4 3 8 0.287153 0 1 0
我想使用不确定性列'dy'
来表示'y'
的误差线。 Seaborn catplots执行的默认自举或标准偏差误差线不能为我提供令人满意的解决方案。
在这里,我提供了最小可验证的示例:
import pandas as pd
import numpy.random as npr
import seaborn as sns
npr.seed(seed=0)
my_sz = 1000
df_x = pd.DataFrame(npr.randint(0,7,size=(my_sz, 1)), columns=['x'])
df_y = pd.DataFrame(npr.randint(5,10,size=(my_sz, 1)), columns=['y'])
df_dy = pd.DataFrame(npr.random(size=(my_sz, 1)), columns=['dy'])
df_col = pd.DataFrame(npr.randint(0,3,size=(my_sz, 1)), columns=['col'])
df_row = pd.DataFrame(npr.randint(0,2,size=(my_sz, 1)), columns=['row'])
df_hue = pd.DataFrame(npr.randint(0,3,size=(my_sz, 1)), columns=['hue'])
df = pd.concat([df_x, df_y, df_dy, df_col, df_row, df_hue], axis=1)
df[['x', 'col', 'row', 'hue']] =df[['x', 'col', 'row', 'hue']].astype('category')
cat_plt = sns.catplot(x='x',
y='y',
hue='hue',
data=df,
row='row',
col='col',
kind='bar',
);
Seaborn categorical bar-plot with default error bars
我尝试了以下solution,但我认为它不适用于多条图。
提前感谢您的时间和帮助。
答案 0 :(得分:2)
你可以这样做:
import pandas as pd
import numpy.random as npr
import seaborn as sns
import matplotlib.pyplot as plt
def errplot(x, y, yerr, hue, **kwargs):
data = kwargs.pop('data')
p = data.pivot_table(index=x, columns=hue, values=y, aggfunc='mean')
err = data.pivot_table(index=x, columns=hue, values=yerr, aggfunc='mean')
p.plot(kind='bar', yerr=err, ax=plt.gca(), **kwargs)
sns.set_theme()
npr.seed(seed=0)
my_sz = 1000
df_x = pd.DataFrame(npr.randint(0, 7, size=(my_sz, 1)), columns=['x'])
df_y = pd.DataFrame(npr.randint(5, 10, size=(my_sz, 1)), columns=['y'])
df_dy = pd.DataFrame(npr.random(size=(my_sz, 1)), columns=['dy'])
df_col = pd.DataFrame(npr.randint(0, 3, size=(my_sz, 1)), columns=['col'])
df_row = pd.DataFrame(npr.randint(0, 2, size=(my_sz, 1)), columns=['row'])
df_hue = pd.DataFrame(npr.randint(0, 3, size=(my_sz, 1)), columns=['hue'])
df = pd.concat([df_x, df_y, df_dy, df_col, df_row, df_hue], axis=1)
df[['x', 'col', 'row', 'hue']] = df[['x', 'col', 'row', 'hue']].astype('category')
g = sns.FacetGrid(df, row='row', col='col')
g.map_dataframe(errplot, "x", "y", "dy", "hue", color=['blue', 'orange', 'green'], width=0.8)
plt.subplots_adjust(right=0.90)
plt.legend(loc='center left', bbox_to_anchor=(1,1))
plt.show()
改编自this answer。
输出: