我试图通过遵循文档的this部分来使用bokeh绘制堆积的条形图。 但是我的数据框要复杂一些。看起来像这样:
events count Name
a 2 jerry
b 1 jerry
a 8 joe
c 1 joe
b 4 megan
c 1 megan
... ... ...
data.user.nunique()
= 11(将在列中)并且data.event.nunique()
= 167(将是每一列的堆叠段。请注意,并非每个用户都引发了所有唯一事件 )
因此根据文档中的代码以及数据框的上述部分:
output_file("stacked.html")
names = data.Name.unique() # ['jerry','joe','megan']
events = data.events.unique() # ['a','b','c']
colors =["#c9d9d3", "#718dbf", "#e84d60"]
data = {'names' : names,
'a' : [2, 8, 0], # a raised 2 times by jerry, 8 times by joe , 0 times by megan
'b' : [1, 0, 4],
'c' : [0, 1, 1]}
我的问题是双重的,1)如何从实际数据集中创建data
字典?
2)是否有解决此问题的替代方法?
答案 0 :(得分:2)
bokeh不一定需要使用字典,因此我们实际上可以使用pivot
Dataframe方法来实现所需的变换并直接绘制结果。
>>> df = pd.DataFrame({
'events': ['a', 'b', 'a', 'c', 'b', 'c'],
'count': [2, 1, 8, 1, 4, 1],
'Name': ['jerry', 'jerry', 'joe', 'joe', 'megan', 'megan']})
>>> df
events count Name
0 a 2 jerry
1 b 1 jerry
2 a 8 joe
3 c 1 joe
4 b 4 megan
5 c 1 megan
转换数据:
>>> df2 = df.pivot(index="Name", columns="events", values="count").fillna(0)
>>> df2
events a b c
Name
jerry 2.0 1.0 0.0
joe 8.0 0.0 1.0
megan 0.0 4.0 1.0
绘制数据:
from bokeh.plotting import figure
from bokeh.palettes import viridis
names = df2.index.tolist()
events = df2.columns.tolist()
color = viridis(len(events))
p = figure(x_range=names)
p.vbar_stack(events, x="Name", source=df2, width=.9, color=color), legend_label=events)
show(p)
另一种绘制方法是使用holoviews库(简单地添加它是因为holoviews可以产生比bokeh更简洁的代码)。 Holoviews会为您处理数据转换,因此您无需付出任何额外的努力:
import holoviews as hv
hv.extension("bokeh")
hv.Bars(df, kdims=["Name", "events"], vdims="count").opts(stacked=True)
对于替代解决方案,我不确定。我看不到对167种事件进行视觉比较是很容易的(这是167种独特的颜色,因此这些颜色可能不太容易辨别-更不用说一个包含167个条目的无用的图例了)。如果这种可视化方法无济于事,我建议您使用Holoviews库为您的每个名称创建一个条形图。然后,您可以为数据中的每个人切换图表。
import holoviews as hv
hv.extension("bokeh")
hv.Bars(df, kdims=["Name", "events"], vdims="count").groupby("Name")