使用xlrd读取日期,使用xlsxwriter在Python中编写它们

时间:2014-05-01 22:23:26

标签: python datetime xlsxwriter

我正在使用xlrd从excel电子表格中读取一堆原始数据,进行各种计算和重新格式化,然后使用xlsxwriter将结果写入新工作簿。

我能够使用xlrd正确读取日期数据并转换为datetime对象,但是当我尝试使用xlsxwriter写这个时,我会收到错误。我已经阅读了xlsxwriter上的所有SO帖子以及excel如何格式化数据等,并用Google搜索,但似乎无法弄明白。

我的代码是:

in_wb = xlrd.open_workbook("in_book.xlsx")
in_sheet = in_wb.sheet_by_name("in_sheet")

out_wb = xlsxwriter.Workbook("out_book.xlsx")
out_sheet = out_wb.add_worksheet("out_sheet")
date_format = out_wb.add_format({'num_format': 'YYYY-MM-DD HH:DD:SS'})

as_tuple = xlrd.xldate_as_tuple(in_sheet.cell_value(0, 0), in_wb.datemode)
as_datetime = datetime.datetime(as_tuple[0], as_tuple[1], as_tuple[2] , as_tuple[3], as_tuple[4], as_tuple[5])

out_sheet.write_datetime(0, 0, as_datetime, date_format)

#print details just to be sure
print as_datetime #prints it in exactly the format I want
print type(as_datetime) #says it is of type 'datetime.datetime'

完整的Traceback错误是(不包括我的py文件的第一次调用):

  File "C:\Python27\lib\site-packages\xlsxwriter\worksheet.py", line 57, in cell_wrapper
return method(self, *args, **kwargs)
  File "C:\Python27\lib\site-packages\xlsxwriter\worksheet.py", line 668, in write_datetime
number = self._convert_date_time(date)
  File "C:\Python27\lib\site-packages\xlsxwriter\worksheet.py", line 3267, in _convert_date_time
return datetime_to_excel_datetime(dt_obj, self.date_1904)
  File "C:\Python27\lib\site-packages\xlsxwriter\utility.py", line 576, in datetime_to_excel_datetime
raise TypeError("Unknown or unsupported datetime type")
  TypeError: Unknown or unsupported datetime type
  Exception LookupError: 'unknown encoding: utf-8' in <bound method Workbook.__del__ of <xlsxwriter.workbook.Workbook object at 0x030BAB50>> ignored

当我打电话给普通&#39; out_sheet.write&#39;相反,生成的电子表格显示了一堆######&#39; ######在单元格中,但当我点击单元格时,它会显示我想要的日期和时间,不知道如何驾驭这些#&####&#39; ####当我这样做的时候。我不在乎使用write_datetime()或只是write(),我只是想让它在输出表单元格中正确显示。

非常感谢你的帮助!

1 个答案:

答案 0 :(得分:3)

我安装了xlrd(0.9.3)和xlsxwriter(0.5.3)的最新版本,并且能够毫无错误地运行您的示例程序:

import xlrd
import xlsxwriter
import datetime

in_wb = xlrd.open_workbook("in_book.xlsx")
in_sheet = in_wb.sheet_by_name("in_sheet")

out_wb = xlsxwriter.Workbook("out_book.xlsx")
out_sheet = out_wb.add_worksheet("out_sheet")
date_format = out_wb.add_format({'num_format': 'YYYY-MM-DD HH:DD:SS'})

as_tuple = xlrd.xldate_as_tuple(in_sheet.cell_value(0, 0), in_wb.datemode)
as_datetime = datetime.datetime(as_tuple[0], as_tuple[1], as_tuple[2],
                                as_tuple[3], as_tuple[4], as_tuple[5])

out_sheet.write_datetime(0, 0, as_datetime, date_format)


print as_datetime
print type(as_datetime)

out_wb.close()

注意,我在最后添加了workbook.close()以避免任何文件关闭问题并使任何错误消息更清晰。这运行并生成了预期的xlsx文件并输出:

$ python so01.py
2014-05-02 00:00:00
<type 'datetime.datetime'> 

注意,从版本0.93开始xlrd也支持xldate_as_datetime()功能。所以你可以更简单地完成转换,如下所示:

as_datetime = xlrd.xldate.xldate_as_datetime(in_sheet.cell_value(0, 0), 
                                             in_wb.datemode)

out_sheet.write_datetime(0, 0, as_datetime, date_format)

最后:

  

当我打电话给普通&#39; out_sheet.write&#39;相反,生成的电子表格显示了一堆######&#39; ######在单元格中,但是当我点击单元格时,它会显示我想要的日期和时间,

这是Excel的标准方式,表示该值太大而无法在单元格中显示(因为它在上面的示例中具有相当长的日期格式)。如果使用worksheet.set_column()扩大列宽,则应看到预期值。