Wkhtmltopdf版本,第一页和TOC

时间:2012-12-21 14:37:45

标签: pdf-generation wkhtmltopdf html-to-pdf

这个非常好的工具的一些问题,遗憾的是缺少许多用法示例。

  1. 手册说明了wkhtmltopdf可能的“降低功能”。我有版本wkhtmltox-0.11.0_rc1-installer.exe,通过运行wkhtmltopdf --version我应该阅读哪些内容以了解我的版本是否为简化版本?
  2. 目前我喜欢wkhtmltopdf的网页,我想稍后阅读和/或存储。要镜像网页,我使用httrack,然后使用wkhtmltopdf *.html offline.pdf生成PDF。如何从* .html列表中设置/指定第一个PDF页面?目前它们似乎按字母顺序转换。
  3. 如果我运行wkhtmltopdf toc http://qt-project.org/doc/qt-4.8/qstring.html qstring.pdf我只是得到一个空白页面,没有TOC。怎么了?
  4. 感谢您的帮助

    编辑:

    @Nenotlep:

    你的TOC技巧完美无缺。

    至于第一页,我不需要实际封面。 我需要的是一种下载/转换给定页面www.site.com/foo.html和所有链接页面(A.html,B.html ...)达到某个深度级别的方法。然后我想要一个以foo.html开头的单个PDF,并且还包含页面A.html,B.html ...(带有相对链接)。

    我认为没有选项可以下载并在最终的PDF中插入链接的页面(如果我错了,请纠正我)。所以我使用httrack.com下载和wkhtmltopdf进行转换。鉴于wkhtmltopdf的字母行为,最好的现在似乎重命名目标页面,使用httrack下载,类似!foo.html。 请让我知道可能的替代方案。

2 个答案:

答案 0 :(得分:3)

对于问题的第3部分(空白TOC),也不会生成最新的稳定版本0.12.5。 pre-release version 0.12.6-dev已在Mac中解决了此问题。

答案 1 :(得分:2)

  1. 我认为所有可用的预编译wkhtmltopdf都是用补丁QT编译的,它们并没有减少。功能减少意味着它是在没有特殊修补版QT的情况下编译的。我使用Windows版本并没有减少。

  2. 我认为cover命令行参数对你有用。我现在无法测试,但尝试像wkhtmltopdf cover derpy.html toc --xsl-style-sheet default.xsl rarity.html twilight.html spike.html equestriadaily.pdf

    这样的命令

    至少在Linux中,我认为asterix * .html只是在执行命令之前爆炸到所有html文件中,所以如果你为封面选择一个html文件,然后在同一文件夹中执行* .html,你将会得到文件两次。解决此问题可能需要一些命令行法术或批处理文件或其他一些技巧。

  3. 这是bug in wkhtmltopdf。解决方法是手动设置tocfile。您可以使用wkhtmltopdf.exe --dump-default-toc-xsl获取默认的tocfile。然后,您可以将输出保存为文件,并将其用作wkhtmltopdf.exe toc --xsl-style-sheet default.xsl www.stackoverflow.com so.pdf