示例数据
import pandas as pd
import matplotlib.pyplot as plt
dummy = {'id': [1,2,3,4,5],
'brand': ['MS', 'Apple', 'MS', 'Google', 'Apple'],
'quarter': ['2017Q2', '2017Q2', '2017Q2', '2016Q1', '2015Q1']}
dummyData = pd.DataFrame(dummy, columns = ['id', 'brand', 'quarter'])
dummyData
# id brand quarter
# 0 1 MS 2017Q2
# 1 2 Apple 2017Q2
# 2 3 MS 2017Q2
# 3 4 Google 2016Q1
# 4 5 Apple 2015Q1
现在我想使用matplotlib和pandas制作直方图,这里是描述
我有一个R背景,使用ggplot非常简单,我想在Python中做同样的事情,但我找不到任何合适的代码,我得到以下提到的错误
TypeError: Empty 'DataFrame': no numeric data to plot
答案 0 :(得分:3)
IIUC,您可以使用groupby
+ count
+ unstack
+ plot
-
plt.style.use('ggplot')
dummyData.groupby(['quarter', 'brand'])\
.brand.count().unstack().plot.bar(legend=True)
plt.show()
作为参考,这是绘制的 -
brand Apple Google MS
quarter
2015Q1 1.0 NaN NaN
2016Q1 NaN 1.0 NaN
2017Q2 1.0 NaN 2.0
答案 1 :(得分:2)
我认为groupby
需要size
,然后unstack
或crosstab
重新塑造。
DataFrame.plot.bar
的最后一个情节:
df = dummyData.groupby(['quarter','brand']).size().unstack(fill_value=0)
#alternative solution
#df = pd.crosstab(dummyData['quarter'], dummyData['brand'])
print (df)
brand Apple Google MS
quarter
2015Q1 1 0 0
2016Q1 0 1 0
2017Q2 1 0 2
df.plot.bar()
答案 2 :(得分:0)
data_frame.attribute_name.value_counts().plot.bar()
iris_data.sample(3)
iris_data.Species.value_counts().plot.bar()