美好的一天很棒的人, 我正在研究Table上的数据框,并希望实现New table。我首先尝试使用以下方法获取新表的测试分数和总平均值:
df = pd.read_csv("testdata.csv")
grouped = df.groupby(["county_id","school_id","student_id"]).mean()
print (grouped)
它给了我这个错误:
KeyError:'county_id'
我的计划是根据county_id, school_id and student_id
对新表进行分组。但是,对于每个唯一索引,将填充其测试分数的平均值和基于带宽(Excellent 20.0-25.0, Good 17.0-19.9 and Pass 16.9 - 14.0
)的备注。
我真的很感激任何有帮助的人。此外,如果可以使用lambda函数来实现这一点也会很酷。谢谢