使用wkhtmltopdf时如何处理ContentNotFoundError?

时间:2014-09-17 15:10:33

标签: qt command-line wkhtmltopdf downloading wkhtmltoimage

有人可以告诉我如何解决以下问题吗?

  1. wkhtmltopdf不具备传递代理信息(-p或--proxy)的选项,与以前的版本不同,它也不使用系统$ http_proxy和$ https_proxy env变量。

  2. wkhtmltopdf无法使用HTTPS / SSL,即使我为libssl.so和libcrypto.so设置了LD_LIBRARY_PATH

    [deploy@localhost ~]$ wkhtmltopdf https://www.google.co.in google.pdf
    loaded the Generic plugin 
    Loading page (1/2)
    Error: Failed loading page https://www.google.co.in (sometimes it will work just to ignore this error with --load-error-handling ignore)
    Exit with code 1 due to network error: UnknownNetworkError
    

    [deploy@localhost ~]$ wkhtmltoimage https://www.google.co.in sample.jpg
    loaded the Generic plugin 
    Loading page (1/2)
    Error: Failed loading page https://www.google.co.in (sometimes it will work just to ignore this error with --load-error-handling ignore)
    Exit with code 1 due to network error: UnknownNetworkError
    
  3. wkhtmltopdf部分使用HTTP。输出的pdf文件缺少一些内容/背景/位置。

    [deploy@localhost ~]$ wkhtmltopdf http://localhost:8880/ sample.pdf
    loaded the Generic plugin 
    Loading page (1/2)
    Printing pages (2/2)                                               
    Done                                                           
    Exit with code 1 due to network error: ContentNotFoundError
    
    [deploy@localhost ~]$ wkhtmltoimage http://localhost:8880/ sample.jpg
    loaded the Generic plugin 
    Loading page (1/2)
    Rendering (2/2)                                                    
    Done                                                               
    Exit with code 1 due to network error: ContentNotFoundError
    
  4. 注意:我使用的是wkhtmltopdf-0.12.1-1.fc20.x86_64和qt-4.8.6-10.fc20.x86_64

4 个答案:

答案 0 :(得分:2)

不幸的是wkhtmltopdf没有处理复杂网站的下载,因为它使用的Qt / QtWebKit库似乎存在一些问题。

一个问题是wkhtmltopdf不支持相对地址(GitHub:#1634#1886#2359QTBUG-46240),例如:

<img src="/images/filetypes/txt.png">
<script src="//cdn.optimizely.com/js/653710485.js">

并将它们加载为本地。我发现的一个解决方案是ex就地编辑器就地纠正html文件:

ex -V1 page.html <<-EOF
  %s,'//,'http://,ge 
  %s,"//,"http://,ge 
  %s,'/,'http://www.example.com/,ge
  %s,"/,"http://www.example.com/,ge
  wq " Update changes and quit.
EOF

然而,它对于在遥控器上具有这些类型的URL的文件不起作用。

另一个问题是它没有处理丢失的资源。您可以尝试指定--load-error-handling ignore,但在大多数情况下它不起作用(请参阅#2051),因此这仍然很出色。解决方法是在转换之前简单地删除这些无效资源。

wkhtmltopdf之外,您可以使用htmldocPhantomJS和其他一些脚本,例如使用rasterize.js

phantomjs rasterize.js http://example.com/

dompdf(适用于PHP的HTML到PDF转换器,您可以通过编辑器安装),下面是示例代码:

<?php
// somewhere early in your project's loading, require the Composer autoloader
// see: http://getcomposer.org/doc/00-intro.md
$HOMEDIR = "/Users/foo";
require $HOMEDIR . '/.composer/vendor/autoload.php';

// disable DOMPDF's internal autoloader if you are using Composer
define('DOMPDF_ENABLE_AUTOLOAD', FALSE);
define('DOMPDF_ENABLE_REMOTE', TRUE);

// include DOMPDF's default configuration
require_once $HOMEDIR . '/.composer/vendor/dompdf/dompdf/dompdf_config.inc.php';

$htmlString = file_get_contents("https://example.com/foo.pdf");

$dompdf = new DOMPDF();
$dompdf->load_html($htmlString);
$dompdf->render();
$dompdf->stream("sample.pdf");

答案 1 :(得分:1)

我的问题解决了从css中删除@ font-face。

答案 2 :(得分:0)

我以前有这个问题。并像下面这样解决。

wkhtmltopdf

在上面的示例中,我有一些“ src”文件和“ url”,它们引用静态目录,但是静态目录不存在,因此wkhtmltopdf引发了该错误。例如:

src:URL(“文件:/// home / ehsan / Projects / Example / main / sib / 静态 /WebYekan.eot”);

还有一件我要说的重要事情是html文件中的所有文件路径都必须是绝对路径。根本不使用相对路径。

希望对您有帮助。

答案 3 :(得分:0)

我进行了很多搜索,但找不到,但终于在这里找到了。我正在使用(./name),但创建了contentnotfound错误。

但最终使用了完整的地址并获得了预期的结果