我有一个推文数据的数据框,最初是这样的:
lang long lat hashtag country
1 it -69.940500 18.486700 DaddyYankeeAlertaRoja DO
2 it -69.940500 18.486700 QueremosConciertoDeAURA DO
3 it -69.940500 18.486700 LoQueDiceLaFoto DO
4 sv 14.167014 56.041735 escSE S
我已将其转换为按国家/地区排序的计数信息,并通过以下方式标记:
d = pd.DataFrame({'count' : all_tweets.groupby(['country', 'hashtag']).size()}).reset_index()
d =
country hashtag count
0 A 100DaysofJapaneseLettering 3
1 A 100happydays 1
2 A 10cities1backpack 2
3 A 12points 6
... ... ... ...
848857 ZW reflections 1
848858 ZW saveKBD 1
848859 ZW sekuru 1
848860 ZW selfie 2
我最终想要绘制每个国家/地区的顶部主题标签。如何获取df中每个国家/地区的最大数量并绘制它?
答案 0 :(得分:0)
我意识到这个问题与Extract row with maximum value in a group pandas dataframe有点重复。
我使用此命令提取了最流行的#标签:
max = d.iloc[d.groupby(['country']).apply(lambda x: x['count'].idxmax())]