在python中,我使用win32com将word文档转换为HTML:
from win32com import client as wc
import os
word = wc.Dispatch('Word.Application')
doc = word.Documents.Open(wordFullName)
doc.SaveAs(htmlFullName, 10)
但HTML的结果编码是gb2312:
<meta http-equiv=Content-Type content="text/html; charset=gb2312" >
如何控制生成的HTML的编码选项?