在多个字段上求平均值

时间:2019-06-25 23:24:05

标签: python pandas pandas-groupby

我正在尝试找出一种在python上进行特定编码的方法。我正在使用与列一起运行的csv数据集;年龄,性别,体重指数,收费,吸烟者,孩子人数。我的问题是,有没有办法找到性别等于男性或女性的BMI平均值?

我了解使用pandas可以给我以下所有列的平均值:

mean_age = df["age"].mean()

我已经尝试过(我认为不会起作用):

mean_age = df["age"].mean(on "sex" = "male")

以及

mean_age = df["age"].mean("sex" = "male")

mean_age = df["age"].mean(where( "sex") = "male")

我想知道是否可以按照其他列上的均值来编码某些东西。

1 个答案:

答案 0 :(得分:0)

我找到了一种分组的方法,该方法可以给我平均值并依靠多个字段:

df.groupby(["sex"]).agg(["mean", "count"])