train[['Pclass', 'Age']].groupby(['Pclass'], as_index=False).median().sort_values(by='Pclass', ascending=True)
我正在进行分组,查找摘要统计信息,并根据列对其进行排序(在这种情况下为' Pclass')。
我如何使用where子句?我要输入的where子句将执行与train[train.Survived==1]
有关如何实现这一目标的任何想法?我正在使用经典的"泰坦尼克号"数据集。
答案 0 :(得分:1)
将train[['Pclass', 'Age']]
更改为
train.loc[train['Survived'] == 1, ['Pclass', 'Age']]
例如,
import pandas as pd
import seaborn as sns
train = sns.load_dataset("titanic")
print(train.loc[train['survived'] == 1, ['pclass', 'age']]
.groupby(['pclass'], as_index=False)
.median()
.sort_values(by='pclass', ascending=True))
打印
pclass age
0 1 35.0
1 2 28.0
2 3 22.0