我正在尝试使用java将word文档转换为pdf。 “XSL-FO to pdf”是我正在研究的方法。
在这种“向XSL-FO发言”的方法中,是否有可用的开源API?或者你可以指导我实施它的步骤吗?
答案 0 :(得分:4)
您要转换哪个版本的Word文档?
RenderX公开提供WordML2FO个样式表,可以将Microsoft的WordprocessingML文档转换为XSL FO(XSLFO)。
这些样式表是由 RenderX的开发团队和 微软一般用途。他们是 用来转换文件 微软的WordprocessingML XML W3C中的词汇到文档中 XSL FO(XSLFO)词汇。
答案 1 :(得分:0)
我完全认为只使用样式表是不可取的,因为有太多东西你会错过(比如解析样式,用于docx / word2003文档中的图形的drawingml / vml等)。 试试这个code sample并从那里移动。另外需要注意的是,如果使用Microsoft的API生成Word 2003/2007,除非您进行所有必需的函数调用,否则它的结构可能始终不正确。
答案 2 :(得分:0)
docx4j(开源,Apache许可证)可以为您完成此任务。
有关详细信息,请参阅docx4j入门指南。
答案 3 :(得分:0)
只要您可以在某处安装OpenOffice,您也可以尝试Docmosis或JODConverter进行转换。它们可以在许多平台上运行,并且可以进行Java控制。