如何在python

时间:2017-12-14 09:13:26

标签: python pandas dataframe matplotlib histogram

示例数据

import pandas as pd
import matplotlib.pyplot as plt

dummy = {'id': [1,2,3,4,5], 
        'brand': ['MS', 'Apple', 'MS', 'Google', 'Apple'], 
        'quarter': ['2017Q2', '2017Q2', '2017Q2', '2016Q1', '2015Q1']}

dummyData = pd.DataFrame(dummy, columns = ['id', 'brand', 'quarter'])
dummyData


# id    brand   quarter
# 0 1   MS      2017Q2
# 1 2   Apple   2017Q2
# 2 3   MS      2017Q2
# 3 4   Google  2016Q1
# 4 5   Apple   2015Q1

现在我想使用matplotlib和pandas制作直方图,这里是描述

  • X轴:季度
  • Y轴:值的计数
  • 直方图Bin:填充2017Q2等品牌有两个MS和Apple的颜色值
  • 传说:品牌名称

我有一个R背景,使用ggplot非常简单,我想在Python中做同样的事情,但我找不到任何合适的代码,我得到以下提到的错误

TypeError: Empty 'DataFrame': no numeric data to plot

3 个答案:

答案 0 :(得分:3)

IIUC,您可以使用groupby + count + unstack + plot -

plt.style.use('ggplot')

dummyData.groupby(['quarter', 'brand'])\
      .brand.count().unstack().plot.bar(legend=True)

plt.show()

enter image description here

作为参考,这是绘制的 -

brand    Apple  Google   MS
quarter                    
2015Q1     1.0     NaN  NaN
2016Q1     NaN     1.0  NaN
2017Q2     1.0     NaN  2.0

答案 1 :(得分:2)

我认为groupby需要size,然后unstackcrosstab重新塑造。

DataFrame.plot.bar的最后一个情节:

df = dummyData.groupby(['quarter','brand']).size().unstack(fill_value=0)
#alternative solution
#df = pd.crosstab(dummyData['quarter'], dummyData['brand'])
print (df)
brand    Apple  Google  MS
quarter                   
2015Q1       1       0   0
2016Q1       0       1   0
2017Q2       1       0   2

df.plot.bar()

graph

答案 2 :(得分:0)

另一种选择

data_frame.attribute_name.value_counts().plot.bar()

示例

iris_data.sample(3)

Iris dataset sample

iris_data.Species.value_counts().plot.bar()

Iris dataset class bar plot