在熊猫数据框架上绘制堆积的条形图

时间:2012-03-30 06:41:28

标签: python pandas

这是我在pycon参加Wesley教程后第一次尝试使用Pandas库。

在对数据帧进行了一些讨论之后,我很高兴能够以我想要的方式按下数据但是在绘制它时遇到了麻烦。我想这也表明了我对matplotlib库的天真。

我拥有的是pandas Series对象,包含以下数据。我想绘制一个带有col 1('file')的条形图作为垂直方向的标签。

sample data here:
http://pastebin.com/y2w0uJPQ 

2 个答案:

答案 0 :(得分:13)

我刚刚在git存储库中为pandas实现了堆叠条形图功能,将成为即将发布的0.7.3版本的一部分:

In [7]: df
Out[7]: 
          a         b         c
0  0.425199  0.564161  0.727342
1  0.174849  0.071170  0.679178
2  0.224619  0.331846  0.468959
3  0.654766  0.189413  0.868011
4  0.617331  0.715088  0.387540
5  0.444001  0.069016  0.417990
6  0.203908  0.689652  0.227135
7  0.382930  0.874078  0.571042
8  0.658687  0.493955  0.245392
9  0.758986  0.385871  0.455357

In [8]: df.plot(kind='barh', stacked=True)

Stacked Bar Plot

它正确处理正值和负值(堆积负值低于原点和上面的正值)

答案 1 :(得分:2)

最近我编写了一个函数来做一些非常相似的事情。这里有一个简化版本:

from matplotlib.backends.backend_agg import FigureCanvasAgg as FigureCanvas
from matplotlib.figure import Figure
from matplotlib.colors import colorConverter
import matplotlib.lines as mlines
import matplotlib

def _add_legend(axes):
    'It adds the legend to the plot'
    box = axes.get_position()
    axes.set_position([box.x0, box.y0, box.width * 0.9, box.height])

    handles, labels = axes.get_legend_handles_labels()

    # sort by the labels
    handel_lables = sorted(zip(handles, labels), key=operator.itemgetter(1))
    handles, labels = zip(*handel_lables)

    axes.legend(handles, labels, bbox_to_anchor=(1.05, 1), loc=2,
                borderaxespad=0., prop={'size':LEGEND_FONT_SIZE},
                fancybox=True, numpoints=1)


def stacked_bars(matrix, fhand, bar_colors=None):
    'It draws stacked columns'
    bar_width = 1
    fig = Figure(figsize=FIGURE_SIZE)
    canvas = FigureCanvas(fig)
    axes = fig.add_subplot(111)
    nrows, ncols = matrix.shape

    bar_locs = range(0, nrows)
    cum_heights = numpy.zeros(nrows)
    for col_index, (col_name, column) in enumerate(matrix.iteritems()):
        color = bar_colors[col_index] if bar_colors is not None else None
        values = column.values
        axes.bar(bar_locs, values, color=color, bottom=cum_heights,
                 width=bar_width, label=col_name)
        cum_heights += values
    min_y, max_y = axes.get_ylim()

    #bar labels
    axes.set_xticks([l + bar_width * 0.4 for l in bar_locs])
    labels = axes.set_xticklabels([str(l) + '  ' for l in matrix.index.values],
                                  fontsize=AXIS_LABELS_FONT_SIZE)
    for label in labels:
        label.set_rotation('vertical')

    _add_legend(axes)

    canvas.print_figure(fhand, format=_get_format_from_fname(fhand.name))
fhand.flush()

我希望它可以帮助你获得一个想法。