我有一个如下所示的Excel工作表:
这是我使用pandas
尝试的:
>>> df = pd.read_excel("temp.xlsx", headers=[5, 6], skiprows=[0,1,2,3,4], usecols="B:F")
>>> df
Header 1 Unnamed: 2 Unnamed: 3 Header 2 Unnamed: 5
0 Sub header 1 Sub header 2 Sub header 3 Sub header 1 Sub header 2
1 111 NaN 131 211 221
2 112 122 132 NaN NaN
3 NaN NaN NaN 213 223
然后我使用df.to_dict()
得到了一个嵌套的dict结构:
>>> pprint(df.to_dict())
{'Header 1': {0: u'Sub header 1', 1: 111, 2: 112, 3: nan},
'Header 2': {0: u'Sub header 1', 1: 211, 2: nan, 3: 213},
'Unnamed: 2': {0: u'Sub header 2', 1: nan, 2: 122, 3: nan},
'Unnamed: 3': {0: u'Sub header 3', 1: 131, 2: 132, 3: nan},
'Unnamed: 5': {0: u'Sub header 2', 1: 221, 2: nan, 3: 223}}
如上所述,我们将Unnamed: x
作为字典中的键。我该如何摆脱它,并在其中放置主标题?
第二,我们如何获得合并标题下的列?