我的df看起来像这样:
data = {'Cumulative': {0: 4, 1: 18, 2: 24, 3: 24, 4: 4, 5: 20, 6: 32, 7: 42}, 'Id': {0: 1, 1: 1, 2: 1, 3: 1, 4: 2, 5: 2, 6: 2, 7: 2}, 'Order': {0: '1-1', 1: '1-2', 2: '1-3', 3: '1-4', 4: '1-1', 5: '1-2', 6: '1-3', 7: '1-4'}, 'Period': {0: 1, 1: 2, 2: 3, 3: 4, 4: 1, 5: 2, 6: 3, 7: 4}, 'Time': {0: '1-1', 1: '1-2', 2: '1-3', 3: '1-4', 4: '1-1', 5: '1-2', 6: '1-3', 7: '1-4'}, 'Year': {0: 1, 1: 1, 2: 1, 3: 1, 4: 1, 5: 1, 6: 1, 7: 1}}
df = pd.DataFrame(data)
我想用Holoviews做的是为每个id绘制一条线。所以'订购'在x轴上,累积'在y轴和每个' Id'有它自己的线(都有相同的颜色)。这是我到目前为止所做的,但它并没有给我正确的结果。
%opts Curve [width=600 height=400 show_grid=True ] (color='indianred', alpha=0.5, line_width=1)
kdims=['Order' ] vdims = ['Cumulative',
] ds = hv.Dataset(df.sort_values(by=['Year','Period']), kdims=kdims, vdims= vdims)
ds.to(hv.Curve, ['Order'] ,'Cumulative' )
答案 0 :(得分:0)
HoloViews只会知道已声明的尺寸。这意味着,当您执行hv.Dataset(df, kdims, vdims)
时,它并不了解“ID&ID”。列,不能分组。这就是我要做的事情:
%%opts Curve [width=600 height=400 show_grid=True ] (color='indianred', alpha=0.5, line_width=1)
ds = hv.Dataset(df).sort(['Year', 'Period'])
ds.to(hv.Curve, 'Order' ,'Cumulative', 'Id')
这里我们声明数据集没有任何明确的kdims或vdims,这意味着我们可以使用HoloViews对数据进行排序,然后使用.to
方法绘制' Order'的曲线。 vs'累积'列,按“&ID”标识分组柱。如果要在一个图上查看所有曲线,只需将其更改为ds.to(hv.Curve, 'Order' ,'Cumulative', 'Id').overlay()
。
答案 1 :(得分:0)
另一种方法是使用叠加层从曲线列表中构建图像。下面的代码对您的数据框进行了子选择。第一列将用作 X 轴值,第二列用作 y 轴值。
df.loc[df['Id']==1][['Period', 'Cumulative']]
然后创建您需要绘制的曲线列表。这些不一定都是曲线,您可以根据需要混合搭配。
# Specified individually
list_of_curves = [
hv.Curve(df.loc[df['Id']==1][['Period', 'Cumulative']], label='Id = 1'),
hv.Curve(df.loc[df['Id']==2][['Period', 'Cumulative']], label='Id = 2'),
]
# As a list comprehension
list_of_curves = [hv.Curve(
df.loc[df['Id']==the_id][['Period', 'Cumulative']],
label=f"Id = {the_id}"
) for the_id in [1,2]]
然后将此曲线列表传递给叠加层,并设置其选项。
hv.Overlay(list_of_curves).opts(
height=300,
width=600,
xlabel='Period',
ylabel='Cumulative',
title='Change in cumulative over period',
legend_position='right'
)
产生下图: