Seaborn中的分组箱线图

时间:2018-11-27 16:55:52

标签: python pandas matplotlib seaborn

在这里一些很棒的人的帮助下,我能够在seaborn中生成我的第一个箱形图。我有2个单独的seaborn图,它们显示了来自Excel工作表的两个比较。我现在想做的是在同一图上同时显示两个数据比较(下面两列中所示),本质上是创建一个分组的箱线图。我试图将数据转换为数据帧,合并并融化它,但未成功。我对python很陌生,所以我想知道是否所有人都可以帮助我。以下是我的代码。

import pandas as pd
import numpy as np
import xlrd
import matplotlib.pyplot as plt
import seaborn as sns
%matplotlib inline
from pandas import ExcelWriter
from pandas import ExcelFile
from pandas import DataFrame


excel_file =  'Project File Merger.xlsm'

list_dfs = []

xls = xlrd.open_workbook(excel_file,on_demand=True)

sheet_names = xls.sheet_names()

d_data = {}
for i, sheet_name in enumerate(xls.sheet_names()):
    df = pd.read_excel(excel_file,sheet_name)
    d_data[sheet_names[i]] = df.loc[:,['HMB','PSPPM']]


keys = list(d_data.keys())
values_list1 = list(d_data.values())

print(keys[0])
print(values_list1[0])

返回哪个

Check1.xlsm
                             HMB                                  PSPPM
0                            0.141005                             0.429498
1                            0.141005                             0.429498
2                            0.066071                             0.706797
3                                 NaN                             0.080378
4                            0.045815                             0.004076
5                                 NaN                             0.630156
6                                 NaN                             0.723957
7                                 NaN                             0.712118
8                            0.391531                             0.791329
9                            0.036823                             0.506834
10                           0.391531                             0.791329

现在,这就是我遇到的问题。我有一个values_list,它具有17个元素(excel文件中的每个工作表一个)。我希望将每个工作表中的数据分组在一起。我想我可能会遇到问题,因为每个列表元素中都有2列?任何建议将不胜感激!

1 个答案:

答案 0 :(得分:1)

我不确定要完全了解您的问题,尤其是与箱形图有关的问题。但是,据我了解,您有一个字典,其中以excel工作表的名称作为键,而有一个DataFrame作为值。您想将所有这些DataFrame合并为一个,以便可以将所有值绘制在一起吗?

如果正确,那么简单的pd.concat就可以接受字典并生成一个以键为索引的新DataFrame。然后,您可以使用reset_index()来展平DataFrame:

new_df = pd.concat(d_data).reset_index()

在那之后,我不知道您想如何绘制箱形图,但是例如,您可以在每张图纸中绘制一个列的值:

sns.boxplot(x='level_0', y='HMB', data=new_df)