我正在尝试找出一种在python上进行特定编码的方法。我正在使用与列一起运行的csv数据集;年龄,性别,体重指数,收费,吸烟者,孩子人数。我的问题是,有没有办法找到性别等于男性或女性的BMI平均值?
我了解使用pandas可以给我以下所有列的平均值:
mean_age = df["age"].mean()
我已经尝试过(我认为不会起作用):
mean_age = df["age"].mean(on "sex" = "male")
以及
mean_age = df["age"].mean("sex" = "male")
和
mean_age = df["age"].mean(where( "sex") = "male")
我想知道是否可以按照其他列上的均值来编码某些东西。
答案 0 :(得分:0)
我找到了一种分组的方法,该方法可以给我平均值并依靠多个字段:
df.groupby(["sex"]).agg(["mean", "count"])