从第5行开始读取excel到python数据框并包含标题

时间:2013-07-09 12:52:48

标签: python excel import pandas

如何在Excel中将Excel数据导入数据框。

基本上,当前的excel工作簿在打开时会运行一些vba,它会刷新数据透视表并执行其他操作。

然后我希望将数据透视表刷新的结果导入到python中的数据框中以供进一步分析。

import xlrd

wb = xlrd.open_workbook('C:\Users\cb\Machine_Learning\cMap_Joins.xlsm')

#sheetnames
print wb.sheet_names()

#number of sheets
print wb.nsheets

文件的刷新和打开工作正常。但是,我如何选择第一张表格中的数据,从第5行开始,包括标题向下到最后一条记录n。

2 个答案:

答案 0 :(得分:23)

您可以使用pandas的ExcelFile parse方法阅读Excel工作表,请参阅io docs

xls = pd.ExcelFile('C:\Users\cb\Machine_Learning\cMap_Joins.xlsm')

df = xls.parse('Sheet1', skiprows=4, index_col=None, na_values=['NA'])

skiprows将忽略前4行(即从行索引4开始)和几个other options

答案 1 :(得分:9)

接受的答案是陈旧的(正如已接受答案的评论中所述)。 现在首选的选项是使用pd.read_excel()