将组索引器添加到pandas dataframe

时间:2016-11-30 19:01:37

标签: python pandas

我有一些看起来像这样的数据:

date_time, user, page
12345, A, index
13456, A, index
14566, B, home
...

我希望存储每行的索引(即按date_time排序时的顺序),包括整体和每页。

总的来说很简单。就像这样:

df['overall_count'] = range(len(df))

但我无法弄清楚如何为网页做这件事。下面的代码得到了我想要的东西,但是它连接到groupby对象,我无法弄清楚如何将它移动到主数据框。

grouped = df.groupby('page')
for name, group in grouped:
    group = group.sort_values('date_time')
    group['page_count'] = range(len(group))

1 个答案:

答案 0 :(得分:3)

如果要分配分组索引,可以使用cumcount:

df.groupby('page').cumcount()