如何根据pandas中另一列的频率值显示列值?

时间:2018-03-09 16:25:56

标签: python pandas dataframe

我有一个数据框,其中行'代码'填充了代码,行'note'填充了注释。因为代码意味着我想要计算它们的频率。例如。使用.value_counts(),然后我还想知道哪些注释附加到任何唯一代码。

例如,代码A在其中一行中有注释'adam'。现在我想算出有多少A,并向A的任何人显示其中一个音符。 (我不想单独计算每个代码,而是一次显示所有代码的频率)

示例:

IN:
code  note
A     adam
A     august
A     abdul
B     bree
B     bar
A     august
B     barnie
B     barnie
C     ceasar
C     coolio
A     august


OUT:
A     5     adam
B     4     bree
C     2     ceasar

1 个答案:

答案 0 :(得分:1)

agg与两个aggfunc一起使用 - countfirst

df.groupby('code').note.agg(['count', 'first'])

      count   first
code               
A         5    adam
B         4    bree
C         2  ceasar