在泰坦尼克号数据集中,如果我绘制“幸存”和“ pclass”
两者都是绝对的 幸存的包含“ 0”或“ 1” pclass包含“ 1”,“ 2”或“ 3”
现在当我绘制x ='survived和y ='pclass'
时我得到这个情节
sns.barplot(x='pclass',y='survived',data=titanic_df)
按班级分组的乘客生存情况:
现在它如何绘制生存变量,因为它是分类变量(0或1)? 为什么y轴的范围是0到0.7?
答案 0 :(得分:1)
您要计算的是每个Pclass的人的生存机会,例如,在您的地块中,拥有Pclass 1(1类)的人的生存概率更高。
答案 1 :(得分:0)
因为seaborn的barplot显示的是均值。满0或1的列数据的均值是多少?1的百分比。
检查文档:https://seaborn.pydata.org/generated/seaborn.barplot.html 它说“记住条形图仅显示平均值(或其他估计量)值也很重要,......”
最好的问候。