是否有可能用每组中的观察次数注释一个seaborn小提琴图?

时间:2017-10-16 14:00:59

标签: python plot seaborn violin-plot

我想用每组中的观察数量来注释我的小提琴情节。所以问题与this one基本相同,除了:

  • python而不是R,
  • seaborn而不是ggplot,
  • 小提琴情节代替箱线图

让我们从Seaborn API documentation获取此示例:

import seaborn as sns
sns.set_style("whitegrid")
tips = sns.load_dataset("tips")
ax = sns.violinplot(x="day", y="total_bill", data=tips)

我希望在小提琴之上有n = 62,n = 19,n = 87,n = 76。这可行吗?

2 个答案:

答案 0 :(得分:5)

在这种情况下,我喜欢预先计算带注释的值并将它们合并到分类轴中。换句话说,预计算例如“Thurs,N = xxx”

看起来像这样:

import seaborn as sns
sns.set_style("whitegrid")
ax= (
    sns.load_dataset("tips")
       .assign(count=lambda df: df['day'].map(df.groupby(by=['day'])['total_bill'].count()))
       .assign(grouper=lambda df: df['day'].astype(str) + '\nN = ' + df['count'].astype(str))
       .sort_values(by='day') 
       .pipe((sns.violinplot, 'data'), x="grouper", y="total_bill")
       .set(xlabel='Day of the Week', ylabel='Total Bill (USD)')   
)

enter image description here

答案 1 :(得分:2)

首先需要存储y位置和x位置的所有值(使用你的数据集)以便使用ax.text,然后一个简单的for循环可以在所需位置写入所有内容:

import seaborn as sns
import matplotlib.pyplot as plt

tips = sns.load_dataset("tips")
ax = sns.violinplot(x="day", y="total_bill", data=tips)

yposlist = tips.groupby(['day'])['total_bill'].median().tolist()
xposlist = range(len(yposlist))
stringlist = ['n = 62','n = 19','n = 87','n = 76']

for i in range(len(stringlist)):
    ax.text(xposlist[i], yposlist[i], stringlist[i])

plt.show()