所以我有一个数据框,其中'Art_Label'列有一个带有文章分类的标签,可能的值是:'politica','deportes','elmundo','otros','policiales', 'economia','社论'
以下是顶部的代码
data = pd.read_csv('/filename.csv', sep=',')
data = data.drop('Unnamed: 0', axis=1)
data.columns
索引([u'Date',u'Title',u'Encabezado',u'Art_Label',u'Media'],dtype ='object')
import matplotlib.pyplot as plt
%matplotlib inline
df = data['Art_Label']
df2 = df.value_counts()
df2.plot(kind = 'hist', xlim = (0,400))
print df2
我想用每个Label及其频率创建一个直方图,我设法使用'df2 = df.value_counts()'得到频率,我希望能够获得直方图上每个值的Label:
这些是我从'df2 = df.value_counts()'获得的结果
politica 332
deportes 323
elmundo 192
otros 191
policiales 137
economia 132
editorial 96
Name: Art_Label, dtype: int64
答案 0 :(得分:0)
对你的问题有点困惑。你想要这个数字吗?如果是这样,我认为'bar'就是你想要的......
MM = pd.Series([332, 323, 192, 191, 137, 132, 96], index=['a', 'b', 'c', 'd', 'e', 'f', 'g'])
MM.plot(kind = 'bar', xlim = (0,400))
plt.show()