在散景中的两列上创建聚类条形图

时间:2017-01-24 07:16:37

标签: python pandas data-visualization bokeh

我有一个如下所示的数据框:

       type    price1     price2
0        A     5450.0     31980.0
1        B     5450.0     20000.0
2        C     15998.0    18100.0

我想要的是一个聚类条形图,它将“类型”与“价格”对比。最终目标是一个图表,每种类型有两个条形,一个条形为“price1”,另一个条形条形为“price2”。两列都在同一个单元($)中。使用Bokeh我可以按类型分组,但我似乎无法通过一个通用的“价格”单元进行分组。到目前为止我有这个代码:

import pandas as pd
import numpy as np
from bokeh.charts import Bar, output_file, show
from bokeh.palettes import Category20 as palette
from bokeh.models import HoverTool, PanTool
p = Bar(
        df,
        plot_width=1300,
        plot_height=900,
        label='type',
        values='price2',
        bar_width=0.4,
        legend='top_right',
        agg='median',
        tools=[HoverTool(), PanTool()],
        palette=palette[20])

但是每种类型只能得到一列。enter image description here

如何修改我的代码以获得每种类型的两个条形码?

2 个答案:

答案 0 :(得分:4)

您要搜索的是grouped Bar图。

但是你必须稍微重新组织你的数据,以便散景(或更好的Pandas)能够正确地分组数据。

df2 = pd.DataFrame(data={'type': ['A','B','C', 'A', 'B', 'C'],
          'price':[5450, 5450, 15998, 3216, 20000, 15000],
          'price_type':['price1', 'price1', 'price1', 'price2', 'price2', 'price2']})

p = Bar(
        df2,
        plot_width=1300,
        plot_height=900,
        label='type',
        values='price',
        bar_width=0.4,
        group='price_type',
        legend='top_right')
  show(p)

result

答案 1 :(得分:2)

你的桌子是宽的"格式。您希望首先使用pd.melt()函数将其融合为长格式。对于可视化,我建议你使用" Seaborn"打包,让您的生活更轻松。你可以在一行中想象每件事。

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

your_df = pd.DataFrame(data={'type': ['A','B','C'],
      'price1':[5450, 5450, 15998],
      'price2' : [3216, 20000, 15000]})

long_df = pd.melt(your_df,id_vars = ['type'],value_vars =['price1','price2'])
print long_df

my_plot = sns.barplot(x="type", y="value",hue = "variable", data=long_df)
sns.plt.show()

enter image description here 可以在这里找到关于长格式和宽格式的好帖子: Reshape Long Format Multivalue Dataframes with Pandas

如果你坚持使用散景这就是你怎么做的,因为renzop指出:

p = Bar(long_df,
    plot_width=1000,
    plot_height=800,
    label='type',
    values='value',
    bar_width=0.4,
    group='variable',
    legend='top_right')

show(p)