我想给Bokeh一个pandas数据框,以绘制一条包含多行的折线图。
x轴应该是df.index,每个df.columns应该是一个单独的行。
这就是我想做的事情:
import pandas as pd
import numpy as np
from bokeh.plotting import figure, show
toy_df = pd.DataFrame(data=np.random.rand(5,3), columns = ('a', 'b' ,'c'), index = pd.DatetimeIndex(start='01-01-2015',periods=5, freq='d'))
p = figure(width=1200, height=900, x_axis_type="datetime")
p.multi_line(df)
show(p)
然而,我收到错误:
RuntimeError: Missing required glyph parameters: ys
相反,我设法做到了这一点:
import pandas as pd
import numpy as np
from bokeh.plotting import figure, show
toy_df = pd.DataFrame(data=np.random.rand(5,3), columns = ('a', 'b' ,'c'), index = pd.DatetimeIndex(start='01-01-2015',periods=5, freq='d'))
ts_list_of_list = []
for i in range(0,len(toy_df.columns)):
ts_list_of_list.append(toy_df.index)
vals_list_of_list = toy_df.values.T.tolist()
p = figure(width=1200, height=900, x_axis_type="datetime")
p.multi_line(ts_list_of_list, vals_list_of_list)
show(p)
那个(无聊的)完成了这项工作,但它对所有3行使用相同的颜色,见下文:
问题:
1)如何将pandas数据帧传递给bokeh的multi_line?
2)如果不能直接使用,我该如何操作数据框数据,以便multi_line会创建不同颜色的每一行?
提前致谢。
答案 0 :(得分:29)
您需要为multi_line提供颜色列表。在你的例子中,你会这样做:
p.multi_line(ts_list_of_list, vals_list_of_list, line_color=['red', 'green', 'blue'])
这是对你的第二个例子的一个更通用的修改,它或多或少地完成了你的结果,但是更简洁,也许更像Pythonic:
import pandas as pd
import numpy as np
from bokeh.palettes import Spectral11
from bokeh.plotting import figure, show, output_file
output_file('temp.html')
toy_df = pd.DataFrame(data=np.random.rand(5,3), columns = ('a', 'b' ,'c'), index = pd.DatetimeIndex(start='01-01-2015',periods=5, freq='d'))
numlines=len(toy_df.columns)
mypalette=Spectral11[0:numlines]
p = figure(width=500, height=300, x_axis_type="datetime")
p.multi_line(xs=[toy_df.index.values]*numlines,
ys=[toy_df[name].values for name in toy_df],
line_color=mypalette,
line_width=5)
show(p)
产生:
答案 1 :(得分:2)
您需要绘制时间序列图表。这将允许您轻松插入图例。 TimeSeries属性可以位于bokeh._legacy_charts下。请参阅以下示例:
http://bokeh.pydata.org/en/0.9.3/docs/user_guide/charts.html