如何将图例和标题添加到Pandas生成的分组直方图中

时间:2015-06-18 15:03:42

标签: pandas matplotlib

我正在尝试绘制由其他属性分组的多个属性的直方图,所有属性都在数据框中。

在此question的帮助下,我可以为剧情设置标题。是否有一种简单的方法可以为每个子图打开图例。

这是我的代码

import numpy as np
from numpy.random import randn,randint
import pandas as pd
from pandas import DataFrame
import pylab as pl

x=DataFrame(randn(100).reshape(20,5),columns=list('abcde'))
x['new']=pd.Series(randint(0,3,10))
x.hist(by='new')
pl.suptitle('hist by new')

enter image description here

1 个答案:

答案 0 :(得分:10)

你可以几乎通过以下方式获得你想要的东西:

g.plot(kind='bar')

但是每组产生一个图(并且没有在组之后命名图,因此它有点无用的IMO。)

这里的东西看起来很漂亮,但确实涉及很多"手册" matplotlib工作,每个人都想避免,但没有人可以:

import numpy.random as rnd
import pandas as pd
import matplotlib.pyplot as plt
from matplotlib import cm

x = pd.DataFrame(rnd.randn(100).reshape(20, 5), columns=list('abcde'))

group_col = 'groups'
groups = ['foo', 'bar', 'baz']
x[group_col] = pd.Series(rnd.choice(groups, len(x)))

g = x.groupby(group_col)
num_groups = g.ngroups

fig, axes = plt.subplots(num_groups)
for i, (k, group) in enumerate(g):
    ax = axes[i]
    ax.set_title(k)
    group = group[[c for c in group.columns if c != group_col]]
    num_columns = len(group.columns)
    colours = cm.Spectral([float(x) / num_columns for x in range(num_columns)])
    ax.hist(group.values, 5, histtype='bar',
            label=list(group.columns), color=colours,
            linewidth=1, edgecolor='white')
    ax.legend()

plt.show()

我认为你能得到你想要的东西: Beautiful histogram

<小时/> 更新 在回应评论时(并且这个答案已经有几年了),我试图将这个答案剥离到最简单的骨头。 可能现在可以标记groupby个对象的图,但我不知道它。

这是最简单的方法:

axes = g.plot(kind='hist')
for i, (groupname, group) in enumerate(g):
    axes[i].set_title(groupname)