熊猫 groupby 和 agg

时间:2021-05-13 06:34:58

标签: pandas group-by pandas-groupby

这是我的数据:

df1 = pd.read_csv('gp_data.csv',sep= ";")
df2 = pd.read_csv('ms_data.csv',sep= ";")
#2.7.2
student_data = pd.concat([df1, df2])
#2.7.3 
df3 = pd.read_csv('gp_grades.csv',sep= ";")
df4 = pd.read_csv('ms_grades.csv',sep= ";")
#2.7.4
student_grades = pd.concat([df3, df4])
#2.7.5
student = pd.merge(left=student_grades, right=student_data, left_on='student_id', right_on='student_id')

问:根据地址和监护人,执行以下操作:

定义一个函数并使用 agg 将该函数应用于旅行时间列。 找出每个组的旅行时间总和。 不要使用 Pandas 提供的答案功能,但您可以使用它来检查。 以下是我的代码:

#1
def travel(series):
  return sum(series == True)

print(student.groupby(['address','guardian']).agg({'traveltime' : travel}))

#2

print(student.agg({'traveltime':'sum'}))

其实我不知道它可能需要什么样的功能,也不太确定第二个问题是否满足。 (打印(student.agg({'traveltime':'sum'})))

0 个答案:

没有答案