说我有一个包含3列的df ['Y / N','Test Before','Test After'],其中“ Y / N”为布尔值,“ Test Before”为“ Test After”为float
例如
'Y/N' 'Test Before' 'Test After'
True 75 100
False 75 50
True 50 60
False 50 40
...
我可以使用df.boxplot(column='Test Before/Test After', by 'Y/N')
创建单独的“列名”箱形图,每个箱形图均按“是/否”分组。
但是,我想创建一个单独的布尔型“ Y / N”箱形图,按“之前测试”,“之后测试”分组,例如:
箱线图A包含df ['Y / N'] ==真的箱形图,对于x值df ['Test Before']和df ['Test After']。
箱线图B包含df ['Y / N'] == False的箱线图,x值为df ['Test Before']和df ['Test After']。
答案 0 :(得分:0)
虽然您期望的结果还不清楚,但是在绘制之前先考虑melting的数据,然后为 Test Stage 提供一个指标列,为 Test Value 提供一个值列>。然后使用以 Y / N 作为图例(色相)系列的seaborn的boxplot进行绘制,或者使用每个 Y / N 的seaborn的FacetGrid进行单独绘制。独特的价值。下面以随机的种子数据进行演示:
数据
import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
np.random.seed(11012018)
df = pd.DataFrame({'Y/N': np.random.choice([True, False], 50),
'Test Before': [np.random.uniform()*10 for _ in range(50)],
'Test After': [np.random.uniform()*10 for _ in range(50)]},
columns = ['Y/N', 'Test Before', 'Test After'])
# MELT DATA (WIDE TO LONG)
melt_df = df.melt(id_vars="Y/N", value_name="Test_Value", var_name="Test_Stage")
print(melt_df.head())
# Y/N Test_Stage Test_Value
# 0 False Test Before 7.573898
# 1 True Test Before 3.487735
# 2 False Test Before 1.506599
# 3 False Test Before 9.833866
# 4 True Test Before 1.340375
# 5 False Test Before 3.678094
# 6 True Test Before 3.407419
# 7 False Test Before 0.427210
# 8 False Test Before 6.988953
# 9 False Test Before 2.912770
情节
fig, ax = plt.subplots(figsize=(10,4))
sns.boxplot(data=melt_df, x='Test_Stage', y='Test_Value', hue='Y/N', ax=ax)
plt.legend(loc='upper right')
g = sns.FacetGrid(melt_df, col="Y/N", height=4, aspect=6/4)
g.map(sns.boxplot, data=melt_df, x='Test_Stage', y='Test_Value')
其他数据
如果不仅仅包含 Test_Before 和 Test_After 值,melt
可以通过 order 指定框图的排列方式缩放到它:
np.random.seed(11012018)
df['Test Middle'] = [np.random.uniform()*10 for _ in range(50)]
melt_df = df.melt(id_vars="Y/N", value_name="Test_Value", var_name="Test_Stage")
fig, ax = plt.subplots(figsize=(10,4))
sns.boxplot(data=melt_df, x='Test_Stage', y='Test_Value', hue='Y/N', ax=ax,
order=['Test Before', 'Test Middle', 'Test After'])
g = sns.FacetGrid(melt_df, col="Y/N", height=4, aspect=6/4)
g.map(sns.boxplot, data=melt_df, x='Test_Stage', y='Test_Value',
order=['Test Before', 'Test Middle', 'Test After'])