我有word文档和以下代码,它使用Apache POI Api将doc转换为html。
serializer.setOutputProperty(OutputKeys.ENCODING, "UTF-8");
serializer.setOutputProperty(OutputKeys.METHOD, "html");
serializer.transform(domSource, streamResult);
但编号,即1),a),i)等和子弹点字符没有被正确解析,我得到像1这样的垃圾字符?当我在编辑器中打开html文件时,我会得到带有不需要的框的数字。我已经尝试了很多,但我没有得到适当的解决方案。
请帮我解决这个编码问题。
由于