使用pandas在唯一的多索引值上获取基于列的均值

时间:2016-12-05 04:24:00

标签: python pandas

美好的一天很棒的人, 我正在研究Table上的数据框,并希望实现New table。我首先尝试使用以下方法获取新表的测试分数和总平均值:

df = pd.read_csv("testdata.csv")

grouped = df.groupby(["county_id","school_id","student_id"]).mean()

print (grouped)

它给了我这个错误:

  

KeyError:'county_id'

我的计划是根据county_id, school_id and student_id对新表进行分组。但是,对于每个唯一索引,将填充其测试分数的平均值和基于带宽(Excellent 20.0-25.0, Good 17.0-19.9 and Pass 16.9 - 14.0)的备注。

我真的很感激任何有帮助的人。此外,如果可以使用lambda函数来实现这一点也会很酷。谢谢

0 个答案:

没有答案