我有一个数据框,其中行'代码'填充了代码,行'note'填充了注释。因为代码意味着我想要计算它们的频率。例如。使用.value_counts(),然后我还想知道哪些注释附加到任何唯一代码。
例如,代码A在其中一行中有注释'adam'。现在我想算出有多少A,并向A的任何人显示其中一个音符。 (我不想单独计算每个代码,而是一次显示所有代码的频率)
示例:
IN:
code note
A adam
A august
A abdul
B bree
B bar
A august
B barnie
B barnie
C ceasar
C coolio
A august
OUT:
A 5 adam
B 4 bree
C 2 ceasar
答案 0 :(得分:1)
将agg
与两个aggfunc一起使用 - count
和first
:
df.groupby('code').note.agg(['count', 'first'])
count first
code
A 5 adam
B 4 bree
C 2 ceasar