java使用从msoffice到pdf的pdfbox

时间:2013-03-01 17:38:04

标签: java pdf ms-office apache-poi pdfbox

是否可以使用Apache PDFBox从MS office文件格式转换(文档不清楚这一点,并且javadoc似乎表明不存在这样的功能),或者我是否需要使用Apache POI进行一些繁琐的转换?

我问的原因是这个StackOverflow问题的答案:

https://stackoverflow.com/questions/10861227/convert-ms-office-to-pdf-in-java

我想我需要使用Apache POI,但我想澄清一下。

2 个答案:

答案 0 :(得分:1)

要进行此转换,您需要MS Office或Google Drive。 PDFBox不会从任何内容转换为PDF,反之亦然 - 它只是读取和写入PDF文件。 Apache POI也不会进行这种类型的转换 - 它只是读取和写入MS Office文件。具体来说,它不会渲染它们。您可以自己为每种类型的Office文件实现一个渲染引擎,但这至少可以说是一项庞大的任务。

答案 1 :(得分:0)

看看https://angelozerr.wordpress.com/2012/12/06/how-to-convert-docxodt-to-pdfhtml-with-java/

它提到的一个可能的选择是XWPFConverterPDFViaIText

  

org.apache.poi.xwpf.converter.pdf提供DOCX 2 Pdf转换器   基于Apache POI XWPFiText

     

您可以使用REST Converter服务测试此转换器   http://xdocreport-converter.opensagres.cloudbees.net/