如何在Java中将doc或docx转换为HTML。使用Apache POI,我能够将doc转换为html但无法将docx转换为html?请给我看一下示例代码?此代码适用于doc但不适用于docx。
HWPFDocumentCore wordDocument = WordToHtmlUtils.loadDoc(stream);
WordToHtmlConverter wordToHtmlConverter = new WordToHtmlConverter(
DocumentBuilderFactory.newInstance().newDocumentBuilder().newDocument());
wordToHtmlConverter.processDocument(wordDocument);
Document htmlDocument = wordToHtmlConverter.getDocument();
ByteArrayOutputStream out = new ByteArrayOutputStream();
DOMSource domSource = new DOMSource(htmlDocument);
StreamResult streamResult = new StreamResult(out);
TransformerFactory tf = TransformerFactory.newInstance();
Transformer serializer = tf.newTransformer();
serializer.setOutputProperty(OutputKeys.ENCODING, "UTF-8");
serializer.setOutputProperty(OutputKeys.INDENT, "yes");
serializer.setOutputProperty(OutputKeys.METHOD, "html");
serializer.transform(domSource, streamResult);
out.close();
String result = new String(out.toByteArray());
答案 0 :(得分:0)
没有理由说这不应该/不能起作用。
请查看以下内容:
简而言之,请确保您使用的是POI的最新版本,并拥有所有必需的库。
(如果您需要其他帮助,请解释什么不起作用。您是否收到编译时错误?运行时错误?意外输出?)