多列数据的分类图及其均值

时间:2019-10-28 14:09:29

标签: pandas matplotlib seaborn

我想在同一图中创建两个熊猫DataFrame列ab的类别图,并共享x和y轴:

import pandas as pd
import seaborn as sns

example = [
    ('exp1','f0', 0.25, 2),
    ('exp1','f1', 0.5, 3),
    ('exp1','f2', 0.75, 4),
    ('exp2','f1', -0.25, 1),
    ('exp2','f2', 1, 2),
    ('exp2','f3', 0, 3)
]
df = pd.DataFrame(example, columns=['exp', 'split', 'a', 'b'])
mean_df = df.groupby('exp')['a'].mean()
g = sns.catplot(x='exp', y='a', data=df, jitter=False)
ax2 = plt.twinx()
sns.catplot(x='exp', y='b', data=df, jitter=False, ax=ax2)

在此实现中,我遇到的问题是类别(x值)的颜色与列的颜色不同。我可以选择这个吗?还是必须更改数据结构?

我还想像下面的图像那样连接分类值的均值:image

2 个答案:

答案 0 :(得分:1)

您可能想先融化数据:

data = df.melt(id_vars='exp', value_vars=['a','b'])

fig, ax = plt.subplots()
sns.scatterplot(data=data,
                x='exp',
                hue='variable',
                y='value',
                ax=ax)

(data.groupby(['exp','variable'])['value']
     .mean()
     .unstack('variable')
     .plot(ax=ax, legend=False)
)
ax.set_xlim(-0.5, 1.5);

输出:

enter image description here

答案 1 :(得分:1)

df = pd.DataFrame(example, columns=['exp', 'split', 'a', 'b'])
mean_df = df.groupby('exp').mean().reset_index()

fig, ax1 = plt.subplots()
ax2 = ax1.twinx()

sns.scatterplot(x='exp', y='a', data=df, color='C0', ax=ax1)
sns.scatterplot(x='exp', y='b', data=df, color='C1', ax=ax2)

sns.lineplot(x='exp',y='a', data=mean_df, color='C0', ax=ax1)
sns.lineplot(x='exp',y='b', data=mean_df, color='C1', ax=ax2)

enter image description here