如何使用 sns.catplot 在箱线图上叠加散点图?

时间:2021-04-29 01:02:51

标签: python seaborn

可以通过简单地连续调用来组合 axes-level 绘图函数:

import seaborn as sns
import matplotlib.pyplot as plt
tips = sns.load_dataset("tips")
sns.set_theme(style="whitegrid")
ax = sns.boxplot(x="day", y="total_bill", data=tips)
ax = sns.stripplot(x="day", y="total_bill", data=tips, 
                   color=".25", alpha=0.7, ax=ax)
plt.show()

如何为图形级函数 sns.catplot() 实现这一点?对 sns.catplot() 的连续调用每次都会创建一个新图形,并且无法传递图形句柄。

# This creates two separate figures:
sns.catplot(..., kind="box")
sns.catplot(..., kind="strip")

1 个答案:

答案 0 :(得分:0)

以下适用于 seaborn v0.11:

import seaborn as sns 
import matplotlib.pyplot as plt
tips = sns.load_dataset("tips")
g = sns.catplot(x="sex", y="total_bill", hue="smoker", col="time",
                data=tips, kind="box",
                palette=["#FFA7A0", "#ABEAC9"],
                height=4, aspect=.7);
g.map_dataframe(sns.stripplot, x="sex", y="total_bill", 
                hue="smoker", palette=["#404040"], 
                alpha=0.6, dodge=True)
# g.map(sns.stripplot, "sex", "total_bill", "smoker", 
#       palette=["#404040"], alpha=0.6, dodge=True)
plt.show()

说明:在第一遍中,箱线图是使用 sns.catplot() 创建的。该函数返回一个 sns.FacetGrid,它容纳分类参数 time 的每个值的不同轴。在第二遍中,此 FacetGrid 被重新用于覆盖散点图(sns.stripplot,或者 sns.swarmplot)。上面使用方法 map_dataframe() 因为 data 是一个带有命名列的 Pandas DataFrame。 (或者,也可以使用 map()。)设置 dodge=True 可确保散点图沿每个 hue 类别的分类轴移动。最后,请注意,通过使用 sns.catplot() 调用 kind="box",然后在第二步中覆盖散点图,duplicated legend entries 的问题被隐式规避了。

Resulting figure

替代方法(不推荐):也可以先创建一个 FacetGrid 对象,然后调用 map_dataframe() 两次。虽然这适用于本示例,但在其他情况下,必须确保属性映射跨方面正确同步(请参阅 docs 中的警告)。 sns.catplot() 会处理这个以及图例。

g = sns.FacetGrid(tips, col="time", height=4, aspect=.7)
g.map_dataframe(sns.boxplot, x="sex", y="total_bill", hue="smoker", 
                palette=["#FFA7A0", "#ABEAC9"])
g.map_dataframe(sns.stripplot, x="sex", y="total_bill", hue="smoker", 
                palette=["#404040"], alpha=0.6, dodge=True)
# Note: the default legend is not resulting in the correct entries.
#       Some fix-up step is required here...
# g.add_legend()
plt.show()