有没有人能够使用python的xlwt写出UTF-8字符?

时间:2011-08-25 02:25:17

标签: python utf-8 multibyte xlwt

我正在尝试将数据写入包含日文字符的excel文件。 我正在使用codec.open()来获取数据,这似乎工作正常,但是当我尝试编写数据时遇到了这个错误:

UnicodeEncodeError: 'ascii' codec can't encode characters in position 16-17: ordinal not in range(128)

我不明白为什么程序会坚持在这里使用ascii。当我创建一个新的工作簿对象时,我使用

wb = xlwt.Workbook(encoding='utf-8')

程序文件本身及其读入的文件都保存为UTF-8。

有人有什么想法吗?

编辑:这是xlwt包的链接。 http://pypi.python.org/pypi/xlwt

2 个答案:

答案 0 :(得分:15)

在Excel 97-2003 XLS文件中,如果可能,则在latin1中编码每个文本,否则使用UTF-16LE编码,并带有标记以显示哪个文本。为此,xlwt需要unicode个对象。如果调用者提供str对象,xlwt将尝试使用Workbook()调用中指定的编码对其进行解码(默认为ascii)。

这有效;尝试运行以下短脚本并使用Excel打开生成的文件。

import xlwt
wb = xlwt.Workbook(encoding="UTF-8")
uc = u"".join(unichr(0x0410 + i) for i in xrange(32)) # some Cyrillic characters
u8 = uc.encode("UTF-8")
ws = wb.add_sheet("demo")
ws.write(0, 0, uc)
ws.write(1, 0, u8)
ws.write(2, 0, xlwt.Formula("A1=A2"))
ws.write(3, 0, "ASCII is a subset of UTF-8")
wb.save("xlwt_write_utf8.xls")

您收到编码错误而不是解码错误这一事实表明脚本的文件输入部分可能存在问题。请提供导致您遇到错误的最短脚本。脚本应该在失败的语句之前包含print repr(your_utf8_text)之类的内容,以便我们可以准确地看到文本数据是什么。请包含完整的错误消息和完整的回溯,以及非常短的输入文件的内容(print repr(contents))。

答案 1 :(得分:2)

根据this问题的建议,在WorkBook上设置编码

wb = xlwt.Workbook(encoding='latin-1') 

也应解决问题(对我有用)。