将ms word文档的特殊字符转换为html

时间:2012-05-30 07:25:14

标签: encoding

我有word文档和以下代码,它使用Apache POI Api将doc转换为html。

   serializer.setOutputProperty(OutputKeys.ENCODING, "UTF-8");

   serializer.setOutputProperty(OutputKeys.METHOD, "html");

   serializer.transform(domSource, streamResult);         

但编号,即1),a),i)等和子弹点字符没有被正确解析,我得到像1这样的垃圾字符?当我在编辑器中打开html文件时,我会得到带有不需要的框的数字。我已经尝试了很多,但我没有得到适当的解决方案。

请帮我解决这个编码问题。

由于

0 个答案:

没有答案