Question

        uid  iid  val
uid                 
1   1    1    5   5.5
2   3    1    4   3.5
2   2    1    4   3.5
2   7    1    4   3.5
2   9    1    4   3.5
2   11   1    4   3.5

从上面的数据框中，我想删除第一列，即：

并提取

    uid  iid  val

1    1    5   5.5
3    1    4   3.5
2    1    4   3.5
7    1    4   3.5
9    1    4   3.5
11   1    4   3.5

有人可以帮忙吗？

Answer 1

通过将uid传递给group_keys=False

，您可以避免首先在索引中加入groupby

df.groupby('uid', group_keys=False).apply(lambda x: x.tail(len(x) // 5))

   uid  iid  val
4    1    5  5.5

Answer 2

使用reset_index或droplevel：

df = df.reset_index(level=0, drop=True)


df = df.reset_index(level='uid', drop=True)

或者：

df.index = df.index.droplevel(0)

Answer 3

您可以将as_index设置为False，以便从df分组中删除索引。

df.groupby('uid', as_index=False)

groupby.apply（..）后Pandas drop group列

3 个答案: