我正在研究泰坦尼克号的乘客数据库。我想仅为男性乘客提取数据,并根据男性乘客是否有配偶或孩子来比较生存率。
我设法使用此代码提取男性信息:
male_over_18 = df[ (df['Sex'] == 'male') & (df['Age'] >=18) ]
我想把我创建的超过18个数据的新男性用于创建图表。我想将它输入到这个swarm图或直方图中,但是当我使用变量名male_over_18
时,它不起作用。我已经包含了下面图表的代码:
sns.swarmplot(x='SibSp',y='Parch',hue="male_over_18",data=df)
答案 0 :(得分:0)
来自seaborn的文件:
Text
这意味着您的Parameters: x, y, hue: names of variables in data or vector data
调用会在swarmplot
中查找名为“male_over_18”的列,以获取色调,这不是您想要的。
您可以致电df
而不是为18岁以上的男性绘制'SibSp'与'Parch'列。
如果你想用色调进行绘图,你需要另一列代表色调,比如'年龄':sns.swarmplot(x='SibSp',y='Parch',data=male_over_18)