将html转换为带内联链接文档的pdf

时间:2008-10-27 07:59:30

标签: java html pdf

我需要优先使用批处理在Java / J2EE平台上以编程方式将一组静态HTML文档转换为单个PDF文件。 pdf文件将分发给站点用户以便离线浏览网页。

要求的要点是:

  1. 顶部的横幅不应出现在最终的pdf文档中。
  2. 左侧的导航栏应从html超链接转换为pdf书签。
  3. 网页中的所有超链接内容(html / pdf / doc / docx等)都应该是带有pdf书签的最终pdf文档的一部分。
  4. 是否有任何标准的开源方式?

3 个答案:

答案 0 :(得分:1)

试试Apache FOP。我只是用它来convert XML to PDF,我认为你可以用HTML / DOM做同样的事情。该网站有a whole section在Java应用程序中运行FOP,并且example code for DOM to PDF

答案 1 :(得分:0)

您可以尝试iText - 但我不确定它是否能处理您需要的所有内容。

此外,如果您探索许多选项,然后决定您能做什么和不能做什么总是更好。在许多情况下,不会有任何开箱即用的库/ API支持您要求的所有内容。

答案 2 :(得分:0)

您可以尝试使用www.alt-soft.com Xml2PDF