获取pandas数据帧中唯一值计数的最大值

时间:2015-06-03 16:53:20

标签: pandas plot max

我有一个推文数据的数据框,最初是这样的:

    lang        long        lat                  hashtag country
1         it  -69.940500  18.486700    DaddyYankeeAlertaRoja      DO
2         it  -69.940500  18.486700  QueremosConciertoDeAURA      DO
3         it  -69.940500  18.486700          LoQueDiceLaFoto      DO
4         sv   14.167014  56.041735                    escSE       S

我已将其转换为按国家/地区排序的计数信息,并通过以下方式标记:

d = pd.DataFrame({'count' : all_tweets.groupby(['country', 'hashtag']).size()}).reset_index()

d =

   country                        hashtag  count
0            A     100DaysofJapaneseLettering      3
1            A                   100happydays      1
2            A              10cities1backpack      2
3            A                       12points      6
...        ...                            ...    ...
848857      ZW                    reflections      1
848858      ZW                        saveKBD      1
848859      ZW                         sekuru      1
848860      ZW                         selfie      2

我最终想要绘制每个国家/地区的顶部主题标签。如何获取df中每个国家/地区的最大数量并绘制它?

1 个答案:

答案 0 :(得分:0)

我意识到这个问题与Extract row with maximum value in a group pandas dataframe有点重复。

我使用此命令提取了最流行的#标签:

max = d.iloc[d.groupby(['country']).apply(lambda x: x['count'].idxmax())]