我有一个包含多个列的数据集,我想创建一个直方图,将字符串列输出到x轴,将int值输出到y轴。
示例数据:
100039241 lustalloverme 275 598 16123 0 28 Dec 2009 20:26:38 GMT diamond lane ; *
100039367 A7madista 213 420 13849 0 28 Dec 2009 20:27:17 GMT Dubai / London
100039585 MoetWitMedusa 349 373 10062 0 28 Dec 2009 20:28:22 GMT NCAT/WishANiggah Woods
100042406 TheCameronApts 27 21 203 0 28 Dec 2009 20:41:59 GMT Silver Spring, MD
100043628 AmeliaSparksx3 804 455 1679 0 28 Dec 2009 20:48:00 GMT Mystic Falls, VA
100048228 AlainaPartlo12 2527 2541 20076 0 28 Dec 2009 21:10:44 GMT
100049128 EliseSandstw12 2315 2197 13475 0 28 Dec 2009 21:15:15 GMT
100049639 GloriaEdwards12 2691 2735 18788 0 28 Dec 2009 21:17:42 GMT
100050202 Ebentwittes 193 1312 5396 0 28 Dec 2009 21:20:30 GMT London, UK
如果我尝试使用df.plot( x='User Location', y='Follower Count', kind='hist')
,它会输出与df.plot.hist()相同的内容:
当我尝试barcharts时,它会给我一个错误
ValueError: Where the $$$$ is !!!!
^
Expected end of text (at char 10), (line:1, col:11)
和
ValueError:
Where the $$$$ is !!!!
^
Expected end of text (at char 10), (line:1, col:11)
这不是第一次遇到空格或$,为什么期望文本结束?
任何人都知道如何正确地做到这一点?提前谢谢!
答案 0 :(得分:0)
如果'用户位置'是独一无二的,你可能想要条形图
df.plot( x='User Location', y='Follower Count', kind='bar')
如果一个位置有多个跟随者计数, 即 loc1,10 loc1,12 loc2,20 loc2,30
您可以先汇总数据框
df.groupby('User_location').agg(sum)['Follower_Count'].plot.bar()
你可以将agg()中的总和改为其他,如mean,max,min等。