如何加入pandas数据帧,以便seaborn boxplot或violinplot可以使用列作为色调?

时间:2017-05-24 15:13:44

标签: python pandas seaborn

我有一个包含多列的数据框,我可以轻松地使用seaborn将其绘制在一个boxplot(或小提琴图等)中,如下所示:

data1 = {'p0':[1.,2.,5,0.], 'p1':[2., 1.,1,3], 'p2':[3., 3.,2., 4.]}
df1 = pd.DataFrame.from_dict(data1)
sns.boxplot(data=df1)

enter image description here

我现在需要的是将这个数据框与另一个数据框合并,这样我就可以在一个箱形图中绘制它们,就像在这里完成一样:http://seaborn.pydata.org/examples/grouped_boxplot.html

我试过添加一个列并连接。结果似乎没问题

data1 = {'p0':[1.,2.,5,0.], 'p1':[2., 1.,1,3], 'p2':[3., 3.,2., 4.]}
data2 = {'p0':[3.,1.,5,1.], 'p1':[3., 2.,3,3], 'p2':[1., 2.,2., 5.]}
df1 = pd.DataFrame.from_dict(data1)
df1['method'] = 'A'
df2 = pd.DataFrame.from_dict(data2)
df2['method'] = 'B'
df_all = pd.concat([df1,df2])
sns.boxplot(data=df_all)

这很有效,但它将方法A和B中的数据汇总在一起。但是这会失败:

sns.boxplot(data=df_all, hue='method')

因为我需要指定x和y。如果我将x指定为x=['p0', 'p1', 'p2'],则将3列进行平均。 所以我想我可以用不同的方式合并数据帧,以便使用seaborn来表示它的简单。

3 个答案:

答案 0 :(得分:3)

我认为这里以简单的方式工作将需要一个像这样的数据框:

  

价值方法p

     

1.0 A p0

     

2.1 A p0

     

3.0 A p1

     

1.3 B p0

     

4.3 B p1

然后,您可以使用sns.boxplot(data=df, hue='method', x='p', y='value')

获得所需内容

我正在研究如何将df1和df2轻松合并到像这样的数据框中,但我并不是真正的熊猫专家。

编辑:想出来,需要使用melt方法:

df3 = pd.concat([df1.melt(id_vars='method', var_name='p'),
                 df2.melt(id_vars='method', var_name='p')],
                 ignore_index=True)
sns.boxplot(x='p', y='value', hue='method', data=df3)

enter image description here

答案 1 :(得分:0)

  

sns.boxplot(data=df1, hue='method')

只包含第一个数据框(df1)中的信息。如果您只使用df1,则df1["method"]中的所有行都具有相同的值(“A”),因此所有行的颜色都相同。

一个选项是连接两个数据帧;例如:

result = pd.concat([df1, df2])
sns.boxplot(data=result, hue='method')

更新的问题:

如果传递data=pandas.Dataframe()作为参数,则应使用数据框的列名定义xy参数。

答案 2 :(得分:0)

试试这个:

fig,ax = plt.subplots(1,2,sharey=True)
for i,g in enumerate(df_all.groupby(by=df_all.method)):
    sns.boxplot(g[1],ax=ax[i])
    ax[i].set_title(g[0])

结果:

enter image description here