我有一些看起来像这样的数据:
date_time, user, page
12345, A, index
13456, A, index
14566, B, home
...
我希望存储每行的索引(即按date_time排序时的顺序),包括整体和每页。
总的来说很简单。就像这样: df['overall_count'] = range(len(df))
但我无法弄清楚如何为网页做这件事。下面的代码得到了我想要的东西,但是它连接到groupby对象,我无法弄清楚如何将它移动到主数据框。
grouped = df.groupby('page')
for name, group in grouped:
group = group.sort_values('date_time')
group['page_count'] = range(len(group))
答案 0 :(得分:3)
如果要分配分组索引,可以使用cumcount:
df.groupby('page').cumcount()