Question

我想在同一图中创建两个熊猫DataFrame列a和b的类别图，并共享x和y轴：

import pandas as pd
import seaborn as sns

example = [
    ('exp1','f0', 0.25, 2),
    ('exp1','f1', 0.5, 3),
    ('exp1','f2', 0.75, 4),
    ('exp2','f1', -0.25, 1),
    ('exp2','f2', 1, 2),
    ('exp2','f3', 0, 3)
]
df = pd.DataFrame(example, columns=['exp', 'split', 'a', 'b'])
mean_df = df.groupby('exp')['a'].mean()
g = sns.catplot(x='exp', y='a', data=df, jitter=False)
ax2 = plt.twinx()
sns.catplot(x='exp', y='b', data=df, jitter=False, ax=ax2)

在此实现中，我遇到的问题是类别（x值）的颜色与列的颜色不同。我可以选择这个吗？还是必须更改数据结构？

我还想像下面的图像那样连接分类值的均值：

Answer 1

您可能想先融化数据：

data = df.melt(id_vars='exp', value_vars=['a','b'])

fig, ax = plt.subplots()
sns.scatterplot(data=data,
                x='exp',
                hue='variable',
                y='value',
                ax=ax)

(data.groupby(['exp','variable'])['value']
     .mean()
     .unstack('variable')
     .plot(ax=ax, legend=False)
)
ax.set_xlim(-0.5, 1.5);

输出：

Answer 2

df = pd.DataFrame(example, columns=['exp', 'split', 'a', 'b'])
mean_df = df.groupby('exp').mean().reset_index()

fig, ax1 = plt.subplots()
ax2 = ax1.twinx()

sns.scatterplot(x='exp', y='a', data=df, color='C0', ax=ax1)
sns.scatterplot(x='exp', y='b', data=df, color='C1', ax=ax2)

sns.lineplot(x='exp',y='a', data=mean_df, color='C0', ax=ax1)
sns.lineplot(x='exp',y='b', data=mean_df, color='C1', ax=ax2)

多列数据的分类图及其均值

2 个答案: