Question

我有一个如下所示的Excel工作表：

这是我使用pandas尝试的：

>>> df = pd.read_excel("temp.xlsx", headers=[5, 6], skiprows=[0,1,2,3,4], usecols="B:F")
>>> df
       Header 1    Unnamed: 2    Unnamed: 3      Header 2    Unnamed: 5
0  Sub header 1  Sub header 2  Sub header 3  Sub header 1  Sub header 2
1           111           NaN           131           211           221
2           112           122           132           NaN           NaN
3           NaN           NaN           NaN           213           223

然后我使用df.to_dict()得到了一个嵌套的dict结构：

>>> pprint(df.to_dict())
{'Header 1': {0: u'Sub header 1', 1: 111, 2: 112, 3: nan},
 'Header 2': {0: u'Sub header 1', 1: 211, 2: nan, 3: 213},
 'Unnamed: 2': {0: u'Sub header 2', 1: nan, 2: 122, 3: nan},
 'Unnamed: 3': {0: u'Sub header 3', 1: 131, 2: 132, 3: nan},
 'Unnamed: 5': {0: u'Sub header 2', 1: 221, 2: nan, 3: 223}}

如上所述，我们将Unnamed: x作为字典中的键。我该如何摆脱它，并在其中放置主标题？

第二，我们如何获得合并标题下的列？

大熊猫从Excel中获取带有多个合并标头的嵌套字典

0 个答案: