我觉得我可能没想到明显的东西。我想在同一个图中输入数据帧每一列的方框图,在x轴上我有列的名称。在seaborn.boxplot()
中,每列都等于groupby
。
在熊猫中我会做
df = pd.DataFrame(data = np.random.random(size=(4,4)), columns = ['A','B','C','D'])
df.boxplot()
产生
现在我想在seaborn中得到同样的东西。但是当我尝试sns.boxplot(df)时,我只得到一个分组的boxplot。如何在seaborn中重现相同的数字?
谢谢
答案 0 :(得分:13)
相当于
的seaborndf.boxplot()
是
sns.boxplot(x="variable", y="value", data=pd.melt(df))
完整示例:
import numpy as np; np.random.seed(42)
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
df = pd.DataFrame(data = np.random.random(size=(4,4)), columns = ['A','B','C','D'])
sns.boxplot(x="variable", y="value", data=pd.melt(df))
plt.show()
这是有效的,因为pd.melt
转换了宽格式数据框
A B C D
0 0.374540 0.950714 0.731994 0.598658
1 0.156019 0.155995 0.058084 0.866176
2 0.601115 0.708073 0.020584 0.969910
3 0.832443 0.212339 0.181825 0.183405
到长篇
variable value
0 A 0.374540
1 A 0.156019
2 A 0.601115
3 A 0.832443
4 B 0.950714
5 B 0.155995
6 B 0.708073
7 B 0.212339
8 C 0.731994
9 C 0.058084
10 C 0.020584
11 C 0.181825
12 D 0.598658
13 D 0.866176
14 D 0.969910
15 D 0.183405
答案 1 :(得分:1)
您可以按照df.plot(kind='box')中的建议使用内置的熊猫方法this question。
我知道,如果您必须使用seaborn,此答案将无济于事,但对要求较简单的人可能有用。
import numpy as np; np.random.seed(42)
import pandas as pd
import matplotlib.pyplot as plt
df = pd.DataFrame(data = np.random.random(size=(4,4)), columns = ['A','B','C','D'])
df.plot(kind='box')
plt.show()
答案 2 :(得分:0)
plt.boxplot([df1,df2], boxprops=dict(color='red'), labels=['title 1','title 2'])