python:将数据帧更新为现有的Excel工作表而不覆盖同一工作表和其他工作表上的内容

时间:2016-08-19 23:53:01

标签: python pandas openpyxl xlrd

为此奋斗了好几个小时,所以我决定向专家寻求帮助:

我想修改现有的Excel工作表而不覆盖内容。 我在这个excel文件中有其他工作表,我不想影响其他工作表。

我已经创建了示例代码,但不知道如何添加我想保留的第二张表。

t=pd.date_range('2004-01-31', freq='M', periods=4)
first=pd.DataFrame({'A':[1,1,1,1],
             'B':[2,2,2,2]}, index=t)
first.index=first.index.strftime('%Y-%m-%d')
writer=pd.ExcelWriter('test.xlsx')
first.to_excel(writer, sheet_name='Here')
first.to_excel(writer, sheet_name='Keep')

#how to update the sheet'Here', cell A5:C6 with following without overwriting the rest?
#I want to keep the sheet "Keep"
update=pd.DataFrame({'A':[3,4],
                     'B':[4,5]}, index=pd.date_range('2004-04-30', 
                                                     periods=2,
                                                     freq='M'))

我研究过SO。但不确定如何将数据帧写入工作表。

示例我尝试过:

import openpyxl
xfile = openpyxl.load_workbook('test.xlsx')
sheet = xfile.get_sheet_by_name('test')
sheet['B5']='wrote!!'
xfile.save('test2.xlsx')

2 个答案:

答案 0 :(得分:9)

自己想出来:

#Prepare the excel we want to write to
t=pd.date_range('2004-01-31', freq='M', periods=4)
first=pd.DataFrame({'A':[1,1,1,1],
             'B':[2,2,2,2]}, index=t)
first.index=first.index.strftime('%Y-%m-%d')
writer=pd.ExcelWriter('test.xlsx')
first.to_excel(writer, sheet_name='Here')
first.to_excel(writer, sheet_name='Keep')

#read the existing sheets so that openpyxl won't create a new one later
book = load_workbook('test.xlsx')
writer = pandas.ExcelWriter('test.xlsx', engine='openpyxl') 
writer.book = book
writer.sheets = dict((ws.title, ws) for ws in book.worksheets)

#update without overwrites
update=pd.DataFrame({'A':[3,4],
                     'B':[4,5]}, index=(pd.date_range('2004-04-30', 
                                                     periods=2,
                                                     freq='M').strftime('%Y-%m-%d')))

update.to_excel(writer, "Here", startrow=1, startcol=2)

writer.save()

答案 1 :(得分:1)

我建议您更新openpyxl的2.4(测试版或结帐版)并使用内置的数据帧支持。现在可以通过openypxl轻松地将这些转换为您可以执行所需的行。

有关详细信息,请参阅http://openpyxl.readthedocs.io/en/latest/pandas.html