CHM或HTML - > PDF,保持HTML链接?

时间:2011-10-14 15:29:26

标签: html pdf hyperlink chm

我们拥有专有的在线图书/手动生成系统,可以从数据库中创建编译的帮助文件(CHM)以及HTML版本的内容。

这非常有效,我们多年来一直在使用该系统而没有经过重大修改。

现在,我们还希望从同一来源生成PDF。我看过几个CHM到PDF和HTML到PDF的转换器,但是我找不到能够正确处理超链接的转换器,尽管这里有很多类似问题,但它没有似乎任何人都找到了一个很好的解决方案(或者至少他们没有费心去发布有关它的任何信息)。

有什么建议吗?我不想在这个领域已经做了很多工作的时候写一个PDF生成器。

2 个答案:

答案 0 :(得分:2)

通常您从抽象来源生成所有这些内容。 HTML作为标准是如此广泛,非常非常难以创建一个通用的HTML转换器到非html的东西,输入可能只是一切。就MSIE而言,CHM似乎支持HTML(阅读:很多)

因此,最明智的做法是确定用于实现基本格式的HTML子集,并尝试从中生成一些内容。考虑通过编辑(批量替换)和脚本来尝试简化html,然后使用最少的格式(以某种抽象形式)提取大部分内容

一般情况下的转换器html->某些事情是非常困难或不理想的(想想把渲染内容的图片放在PDF中),所以你总是在谈论子集。

答案 1 :(得分:1)

我是转换html to pdf的商家的一部分所有者:Docraptor。

以下是我认为可以演示“正确”处理超链接的示例。也就是说,外部链接被发送到默认Web浏览器,并且哈希链接跳转到PDF中显示“Test!”的相关位置。您可以查看此示例here的PDF输出。

<html>
  <head>
    <style type="text/css">
      hr {page-break-after:always;}
    </style>
  <body>
    <a href="http://www.google.com">Google</a>
    <a href="#test">Test?</a>
    <hr />
    <h1 id="test">Test!</h1>
  </body>
</html>

此示例中的hr样式就是这样,我可以有两页文本,这样链接就会展示功能。