[背景资料]
我们有一个解决方案,可以使用Word自动化服务器端将HTM文档转换为Docx,PDF或打印文档。这个解决方案在最新版本的Windows Server 2012中爆发。我们了解到MS并不打算以这种方式运行Word,在使用MS支持工程师解决问题后,我们得出的结论是它永远不会工作。
[当前]
我目前正在研究我的公司可以用来重新获得此功能的潜在技术和工具。我们需要能够将Docx,PDF和打印文件创建到本地打印机。
我已经研究了很多工具,目前我正倾向于Apache FOP,这似乎为我们处理PDF和打印。
但是,我正在寻找一些建议和建议我们可以用来实现纯Java方法的工具。目前,我们的应用程序创建包含所有必需信息的HTM文件。理想情况下,我们希望获取这些HTM文件并将它们“转换”为Docx / XLS-FO格式。
[问题]
所以我的问题是我希望你能够帮助我。 我可以用来获得
的最佳工具是什么或者实现这一目标的最佳流程是什么?有没有人在过去成功找到解决方案?
谢谢
答案 0 :(得分:0)
这取决于控制级别和源HTML的复杂性。有HTML to FO stylesheets,但您可能会发现他们需要您的特定需求。
因此,您可以使用Jericho解析器来读取HTML并生成FO。或者直接使用Apache PDFBox和Apache POI
生成目标格式这一切都归结为你想要/需要的控制水平
答案 1 :(得分:0)
docx4j-ImportXHTML会让您从XHTML转到docx。从那里,您可以使用docx4j(或其他一些解决方案,例如LibreOffice / OpenOffice)来执行docx到PDF。
docx4j支持docx到XSL FO,默认情况下使用FOP。