在Java中将Doc或Docx转换为HTML

时间:2012-01-28 16:57:18

标签: java spring-mvc apache-poi

如何在Java中将doc或docx转换为HTML。使用Apache POI,我能够将doc转换为html但无法将docx转换为html?请给我看一下示例代码?此代码适用于doc但不适用于docx。

        HWPFDocumentCore wordDocument = WordToHtmlUtils.loadDoc(stream);

        WordToHtmlConverter wordToHtmlConverter = new WordToHtmlConverter(
                DocumentBuilderFactory.newInstance().newDocumentBuilder().newDocument());
        wordToHtmlConverter.processDocument(wordDocument);
        Document htmlDocument = wordToHtmlConverter.getDocument();
        ByteArrayOutputStream out = new ByteArrayOutputStream();
        DOMSource domSource = new DOMSource(htmlDocument);
        StreamResult streamResult = new StreamResult(out);

        TransformerFactory tf = TransformerFactory.newInstance();
        Transformer serializer = tf.newTransformer();
        serializer.setOutputProperty(OutputKeys.ENCODING, "UTF-8");
        serializer.setOutputProperty(OutputKeys.INDENT, "yes");
        serializer.setOutputProperty(OutputKeys.METHOD, "html");
        serializer.transform(domSource, streamResult);
        out.close();

        String result = new String(out.toByteArray());

1 个答案:

答案 0 :(得分:0)

没有理由说这不应该/不能起作用。

请查看以下内容:

简而言之,请确保您使用的是POI的最新版本,并拥有所有必需的库。

(如果您需要其他帮助,请解释什么不起作用。您是否收到编译时错误?运行时错误?意外输出?)