如何在Excel中将Excel数据导入数据框。
基本上,当前的excel工作簿在打开时会运行一些vba,它会刷新数据透视表并执行其他操作。
然后我希望将数据透视表刷新的结果导入到python中的数据框中以供进一步分析。
import xlrd
wb = xlrd.open_workbook('C:\Users\cb\Machine_Learning\cMap_Joins.xlsm')
#sheetnames
print wb.sheet_names()
#number of sheets
print wb.nsheets
文件的刷新和打开工作正常。但是,我如何选择第一张表格中的数据,从第5行开始,包括标题向下到最后一条记录n。
答案 0 :(得分:23)
您可以使用pandas的ExcelFile parse
方法阅读Excel工作表,请参阅io docs:
xls = pd.ExcelFile('C:\Users\cb\Machine_Learning\cMap_Joins.xlsm')
df = xls.parse('Sheet1', skiprows=4, index_col=None, na_values=['NA'])
skiprows
将忽略前4行(即从行索引4开始)和几个other options。
答案 1 :(得分:9)
接受的答案是陈旧的(正如已接受答案的评论中所述)。 现在首选的选项是使用pd.read_excel()