直方图在pandas中绘制一列(字符串)和第二列(int)

时间:2016-04-18 13:52:28

标签: python pandas plot graph

我有一个包含多个列的数据集,我想创建一个直方图,将字符串列输出到x轴,将int值输出到y轴。

示例数据:

100039241   lustalloverme   275 598 16123   0   28 Dec 2009 20:26:38 GMT    diamond lane ; *
100039367   A7madista   213 420 13849   0   28 Dec 2009 20:27:17 GMT    Dubai / London
100039585   MoetWitMedusa   349 373 10062   0   28 Dec 2009 20:28:22 GMT    NCAT/WishANiggah Woods
100042406   TheCameronApts  27  21  203 0   28 Dec 2009 20:41:59 GMT    Silver Spring, MD
100043628   AmeliaSparksx3  804 455 1679    0   28 Dec 2009 20:48:00 GMT    Mystic Falls, VA
100048228   AlainaPartlo12  2527    2541    20076   0   28 Dec 2009 21:10:44 GMT    
100049128   EliseSandstw12  2315    2197    13475   0   28 Dec 2009 21:15:15 GMT    
100049639   GloriaEdwards12 2691    2735    18788   0   28 Dec 2009 21:17:42 GMT    
100050202   Ebentwittes 193 1312    5396    0   28 Dec 2009 21:20:30 GMT    London, UK

如果我尝试使用df.plot( x='User Location', y='Follower Count', kind='hist'),它会输出与df.plot.hist()相同的内容:

this

当我尝试barcharts时,它会给我一个错误

ValueError: Where the $$$$ is !!!! 
                 ^ 
Expected end of text (at char 10), (line:1, col:11)

ValueError: 
Where the $$$$ is !!!!
          ^
Expected end of text (at char 10), (line:1, col:11)

这不是第一次遇到空格或$,为什么期望文本结束?

任何人都知道如何正确地做到这一点?提前谢谢!

1 个答案:

答案 0 :(得分:0)

如果'用户位置'是独一无二的,你可能想要条形图

df.plot( x='User Location', y='Follower Count', kind='bar')

如果一个位置有多个跟随者计数, 即 loc1,10 loc1,12 loc2,20 loc2,30

您可以先汇总数据框

df.groupby('User_location').agg(sum)['Follower_Count'].plot.bar()

你可以将agg()中的总和改为其他,如mean,max,min等。