Question

我有一个数据框，其中行'代码'填充了代码，行'note'填充了注释。因为代码意味着我想要计算它们的频率。例如。使用.value_counts（），然后我还想知道哪些注释附加到任何唯一代码。

例如，代码A在其中一行中有注释'adam'。现在我想算出有多少A，并向A的任何人显示其中一个音符。（我不想单独计算每个代码，而是一次显示所有代码的频率）

示例：

IN:
code  note
A     adam
A     august
A     abdul
B     bree
B     bar
A     august
B     barnie
B     barnie
C     ceasar
C     coolio
A     august

OUT:
A     5     adam
B     4     bree
C     2     ceasar

Answer 1

将agg与两个aggfunc一起使用 - count和first：

df.groupby('code').note.agg(['count', 'first'])

      count   first
code               
A         5    adam
B         4    bree
C         2  ceasar