熊猫:从大型Excel文件中的每个电子表格生成数据框

时间:2017-03-01 16:56:03

标签: excel pandas dataframe spreadsheet jupyter

我有一个大的excel文件,我已经导入到大熊猫中,由92张纸组成。

我想使用循环或某种工具从每个电子表格中的数据(每个电子表格中的一个数据帧)生成数据帧,这也会自动命名每个数据帧。

我刚刚开始使用pandas和jupyter,所以我根本没有经验。

这是我到目前为止的代码:

import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
import datetime
%matplotlib inline

concdata = pd.ExcelFile('Documents/Research Project/Data-Ana/11July-27Dec.xlsx')

我还有一份所有电子表格名称的列表:

#concdata.sheet_names

谢谢!

1 个答案:

答案 0 :(得分:0)

不是让每个DataFrame都有自己的变量,而是可以在Python字典中为每个工作表分配一个名称,如下所示:

dfs = {}
for sheet in concdata.sheet_names:
    dfs[sheet] = concdata.parse(sheet)

然后使用工作表名称访问每个DataFrame:

dfs['sheet_name_here']

这样做可以让你有amortised O(1) lookup张。