Question

我想在pandas中使用seaborn绘制箱图，因为它是一种更好的可视化数据的方法，但我对它并不太熟悉。我有三个不同指标的数据框，我想比较不同的指标。我将遍历文件路径以访问它们。

for path in paths: 
   df = pd.read_csv(path)

每个指标的dfs是分开的，看起来像这样（其中....表示填充数据值）。 1,2,3,4,5是列名，表示不同的试验：

    1  2  3  4  5
0   ..............
1   ..............
2   ..............
3   ..............
4   ..............

我希望获得试验1,2,3,4,5以及3个指标中的每个指标的所有图表，其中三个指标的所有第一个试验图将在左侧，然后全部第二个试验地块就在右侧，依此类推。

我怎么能在海边做这个呢？我知道我可以通过循环路径并使用像这样的boxplot函数为每个度量单独创建一个绘图：

sns.boxplot(data=df)

但是，我怎样才能适应其他指标＆＃39;在同一个地块上并排绘制？

Answer 1

首先考虑为每个相应的数据框分配像 Trial 这样的分组列，然后为您的数据框分配pd.concat，最后为指标/值长整数据框分配pd.melt数据在与seaborn密谋之前。下面用随机数据进行演示：

import pandas as pd
import numpy as np
from matplotlib import pyplot as plt
import seaborn as sns

np.random.seed(44)
# DATAFRAMES WITH TRIAL COLUMN ASSIGNED
df1 = pd.DataFrame(np.random.randn(5,5), columns=list(range(1,6))).assign(Trial=1)
df2 = pd.DataFrame(np.random.randn(5,5), columns=list(range(1,6))).assign(Trial=2)
df3 = pd.DataFrame(np.random.randn(5,5), columns=list(range(1,6))).assign(Trial=3)

cdf = pd.concat([df1, df2, df3])                                # CONCATENATE
mdf = pd.melt(cdf, id_vars=['Trial'], var_name=['Number'])      # MELT

print(mdf.head())
#    Trial Number     value
# 0      1      1 -0.750615
# 1      1      1 -1.715070
# 2      1      1 -0.963404
# 3      1      1  0.360856
# 4      1      1 -1.190504

ax = sns.boxplot(x="Trial", y="value", hue="Number", data=mdf)  # RUN PLOT   
plt.show()

plt.clf()
plt.close()

Answer 2

# libraries
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np
import pandas as pd
from random import randint, gauss

# create a DataFrame
df = pd.DataFrame({
    'Sensations':[randint(1,3) for i in range(300)]
})
df['Temperature'] = df['Sensations'].map(lambda x: gauss(0.8/x,0.1)*40)
df['Sensations'] = df['Sensations'].map({1:'hot',2:'normal',3:'cold'})

# create plot
ax = sns.boxplot(x="Sensations", y="Temperature", data=df)

# show plot
plt.show()

Boxplot example

在seaborn中绘制多个箱形图？

2 个答案: