我一直在尝试将doc / docx文件转换为html,我发现最好的选择是docx4j。 任何人都可以帮我直接命令行完成这项工作。
我试过了:
java -cp docx4j.jar:log4j-1.2.15.jar org.docx4j.samples.CreateHtml [input.docx]
作为回应,我希望HTML输出(无论是控制台还是文件)。
答案 0 :(得分:6)
查看http://dev.plutext.org/svn/docx4j/trunk/docx4j/docs/Docx4j_GettingStarted.html和samples dir,我认为
java -cp docx4j.jar:log4j-1.2.15.jar org.docx4j.samples.CreateHtml [input.docx]
应该有效。请注意以下使用入门> 命令行示例部分:
如果docx中有任何图像,您还需要:
xmlgraphics-commons-1.4.jar commons-logging-1.1.1.jar
在你的类路径上。
答案 1 :(得分:1)
非常感谢ax提供思路,但该命令给出了Class missing错误,因此需要在路径中包含其他jar文件。
java -cp docx4j-2.6.0.jar:log4j-1.2.15.jar:xalan-2.7.1.jar:serializer-2.7.1.jar:xml-apis-1.3.04.jar:commons-logging-1.1.1.jar:commons-lang-2.4.jar:commons-io-1.3.1.jar:commons-codec-1.3.jar:xmlgraphics-commons-1.4.jar org.docx4j.samples.CreateHtml input.doc