我有一个电子邮件数据框,其中包含“至”和“来自”列,其中许多具有相同的值。例如,foo @ gmail.com可以在“至”和“从”列中。我想要一个结合了两列的值计数的输出。
例如,我已经尝试过:
usd_data['to'].value_counts()
这提供了“至”列的值计数。然后,我需要对'from'列进行单独的操作并将其合并。
另外,这个:
usd_data.groupby(['from', 'to']).size().reset_index(name='Freq')
newusd.sort_values(by="Freq", ascending=False)
提供了一对独特的电子邮件,这很有趣,但不是我想要的。
我想要一个输出表,其中电子邮件为第一列,计数为第二列。它是“ to”和“ from”列中的计数。