我有以下代码:
df = pageview_df[['student_id', 'page_id']].groupby('student_id').agg('count')
df.head(3)
生成以下数据框:
page_id
student_id
1 22
2 34
3 30
然后,为了尝试只有一层列,我重置索引:
df.reset_index(inplace=True)
df.head(3)
导致此数据框:
student_id page_id
0 1 22
1 2 34
2 3 30
但是,我希望摆脱新的自动生成的索引,并使用student_id
作为新索引:
df = df.set_index('student_id')
df.head(3)
但是,这段代码给了我最初的东西:
page_id
student_id
1 22
2 34
3 30
有人可以解释一下为什么它会这样运作吗?我该如何解决这个问题?我想获取这个数据帧:
student_id page_id
1 22
2 34
3 30