使用具有多个工作表的Excel时,空的熊猫数据框

时间:2015-03-10 13:36:55

标签: excel pandas

我正在使用excel表的目录,并决定使用Panda Dataframes来处理它。作为一个例子,我有一个表格的excel电子表格: Excel sheet I want to parse

每个Excel文件都有多个工作表。此外,它们包含合并的单元格。为了解决这个问题,我编写了以下代码:

import pandas as pd
import os

files=os.listdir(path)
files_xl=[file for file in files if file[-4:]=='xlsx']

df=pd.DataFrame()

for f in files_xl:
    try:
        data=pd.ExcelFile(path+f)
        xl=[data.parse(sheet_name) for sheet_name in data.sheet_names]
        for item in xl:
            item.index=pd.Series(item.index).fillna(method='ffill')
            df.append(item)
    except:
        continue

但是,它(1)返回一个空数据帧,(2)不替换合并单元格产生的NaN。

0 个答案:

没有答案