有关sns.barplot及其工作方式的问题?

时间:2018-12-18 15:45:51

标签: python matplotlib bar-chart seaborn data-analysis

在泰坦尼克号数据集中,如果我绘制“幸存”和“ pclass”

两者都是绝对的 幸存的包含“ 0”或“ 1” pclass包含“ 1”,“ 2”或“ 3”

现在当我绘制x ='survived和y ='pclass'

我得到这个情节

sns.barplot(x='pclass',y='survived',data=titanic_df)

按班级分组的乘客生存情况: Survival of the passengers grouped by the class

现在它如何绘制生存变量,因为它是分类变量(0或1)? 为什么y轴的范围是0到0.7?

2 个答案:

答案 0 :(得分:1)

您要计算的是每个Pclass的人的生存机会,例如,在您的地块中,拥有Pclass 1(1类)的人的生存概率更高。

答案 1 :(得分:0)

因为seaborn的barplot显示的是均值。满0或1的列数据的均值是多少?1的百分比。

检查文档:https://seaborn.pydata.org/generated/seaborn.barplot.html 它说“记住条形图仅显示平均值(或其他估计量)值也很重要,......”

最好的问候。