我正在使用excel表的目录,并决定使用Panda Dataframes来处理它。作为一个例子,我有一个表格的excel电子表格:
每个Excel文件都有多个工作表。此外,它们包含合并的单元格。为了解决这个问题,我编写了以下代码:
import pandas as pd
import os
files=os.listdir(path)
files_xl=[file for file in files if file[-4:]=='xlsx']
df=pd.DataFrame()
for f in files_xl:
try:
data=pd.ExcelFile(path+f)
xl=[data.parse(sheet_name) for sheet_name in data.sheet_names]
for item in xl:
item.index=pd.Series(item.index).fillna(method='ffill')
df.append(item)
except:
continue
但是,它(1)返回一个空数据帧,(2)不替换合并单元格产生的NaN。