是否可以使用Apache PDFBox从MS office文件格式转换(文档不清楚这一点,并且javadoc似乎表明不存在这样的功能),或者我是否需要使用Apache POI进行一些繁琐的转换?
我问的原因是这个StackOverflow问题的答案:
https://stackoverflow.com/questions/10861227/convert-ms-office-to-pdf-in-java
我想我需要使用Apache POI,但我想澄清一下。
答案 0 :(得分:1)
要进行此转换,您需要MS Office或Google Drive。 PDFBox不会从任何内容转换为PDF,反之亦然 - 它只是读取和写入PDF文件。 Apache POI也不会进行这种类型的转换 - 它只是读取和写入MS Office文件。具体来说,它不会渲染它们。您可以自己为每种类型的Office文件实现一个渲染引擎,但这至少可以说是一项庞大的任务。
答案 1 :(得分:0)
看看https://angelozerr.wordpress.com/2012/12/06/how-to-convert-docxodt-to-pdfhtml-with-java/。
它提到的一个可能的选择是XWPFConverterPDFViaIText:
org.apache.poi.xwpf.converter.pdf提供DOCX 2 Pdf转换器 基于Apache POI XWPF和iText。
您可以使用REST Converter服务测试此转换器 http://xdocreport-converter.opensagres.cloudbees.net/