应用错误收集

我正在使用excel表的目录，并决定使用Panda Dataframes来处理它。作为一个例子，我有一个表格的excel电子表格： Excel sheet I want to parse

每个Excel文件都有多个工作表。此外，它们包含合并的单元格。为了解决这个问题，我编写了以下代码：

import pandas as pd
import os

files=os.listdir(path)
files_xl=[file for file in files if file[-4:]=='xlsx']

df=pd.DataFrame()

for f in files_xl:
    try:
        data=pd.ExcelFile(path+f)
        xl=[data.parse(sheet_name) for sheet_name in data.sheet_names]
        for item in xl:
            item.index=pd.Series(item.index).fillna(method='ffill')
            df.append(item)
    except:
        continue

但是，它（1）返回一个空数据帧，（2）不替换合并单元格产生的NaN。

使用具有多个工作表的Excel时，空的熊猫数据框

0 个答案: