groupby.value_counts()之后的pandas reset_index

时间:2016-09-29 19:41:04

标签: python pandas dataframe data-manipulation data-science

我正在尝试将列分组并计算另一列上的值计数。

    A  Amt
0   1   20
1   1   20
2   1   20
3   1   30
4   1   30
5   1   30
6   1   30
7   1   40
8   1   40
9   2   10
10  2   10
11  2   40
12  2   40
13  2   40

dftest看起来像

grouper = dftest.groupby('A')
df_grouped = grouper['Amt'].value_counts()

执行分组

   A  Amt
1  30     4
   20     3
   40     2
2  40     3
   10     2
Name: Amt, dtype: int64

给出了

reset_index

我想要的是保持每组的前两行

此外,当我尝试df_grouped.reset_index()

时,我对错误感到困惑
<xsd:schema>

给出以下错误

  

df_grouped.reset_index()   ValueError:无法插入Amt,已存在

1 个答案:

答案 0 :(得分:27)

reset_index中需要参数name,因为Series名称与MultiIndex级别之一的名称相同:

df_grouped.reset_index(name='count')

另一个解决方案是rename Series名称:

print (df_grouped.rename('count').reset_index())

   A  Amt  count
0  1   30      4
1  1   20      3
2  1   40      2
3  2   40      3
4  2   10      2

更常见的解决方案value_counts是汇总size

df_grouped1 =  dftest.groupby(['A','Amt']).size().rename('count').reset_index()

print (df_grouped1)
   A  Amt  count
0  1   20      3
1  1   30      4
2  1   40      2
3  2   10      2
4  2   40      3