在这里一些很棒的人的帮助下,我能够在seaborn中生成我的第一个箱形图。我有2个单独的seaborn图,它们显示了来自Excel工作表的两个比较。我现在想做的是在同一图上同时显示两个数据比较(下面两列中所示),本质上是创建一个分组的箱线图。我试图将数据转换为数据帧,合并并融化它,但未成功。我对python很陌生,所以我想知道是否所有人都可以帮助我。以下是我的代码。
import pandas as pd
import numpy as np
import xlrd
import matplotlib.pyplot as plt
import seaborn as sns
%matplotlib inline
from pandas import ExcelWriter
from pandas import ExcelFile
from pandas import DataFrame
excel_file = 'Project File Merger.xlsm'
list_dfs = []
xls = xlrd.open_workbook(excel_file,on_demand=True)
sheet_names = xls.sheet_names()
d_data = {}
for i, sheet_name in enumerate(xls.sheet_names()):
df = pd.read_excel(excel_file,sheet_name)
d_data[sheet_names[i]] = df.loc[:,['HMB','PSPPM']]
keys = list(d_data.keys())
values_list1 = list(d_data.values())
print(keys[0])
print(values_list1[0])
返回哪个
Check1.xlsm
HMB PSPPM
0 0.141005 0.429498
1 0.141005 0.429498
2 0.066071 0.706797
3 NaN 0.080378
4 0.045815 0.004076
5 NaN 0.630156
6 NaN 0.723957
7 NaN 0.712118
8 0.391531 0.791329
9 0.036823 0.506834
10 0.391531 0.791329
现在,这就是我遇到的问题。我有一个values_list,它具有17个元素(excel文件中的每个工作表一个)。我希望将每个工作表中的数据分组在一起。我想我可能会遇到问题,因为每个列表元素中都有2列?任何建议将不胜感激!
答案 0 :(得分:1)
我不确定要完全了解您的问题,尤其是与箱形图有关的问题。但是,据我了解,您有一个字典,其中以excel工作表的名称作为键,而有一个DataFrame作为值。您想将所有这些DataFrame合并为一个,以便可以将所有值绘制在一起吗?
如果正确,那么简单的pd.concat
就可以接受字典并生成一个以键为索引的新DataFrame。然后,您可以使用reset_index()
来展平DataFrame:
new_df = pd.concat(d_data).reset_index()
在那之后,我不知道您想如何绘制箱形图,但是例如,您可以在每张图纸中绘制一个列的值:
sns.boxplot(x='level_0', y='HMB', data=new_df)