wkhtmltopdf输出乱码文本

时间:2016-03-22 15:35:05

标签: wkhtmltopdf

我刚刚安装了wkhtmltopdf-amd64(0.12.3)的最新静态版本。在我转换为PDF的任何html页面上,文本显示为实心方块。

google主页的PDF格式示例:

[acoder@box bin]# ./wkhtmltopdf-amd64 http://google.com goog.pdf

enter image description here

或者,这是一个更简单的HTML源文档:

<!doctype html>
<html lang="en">
<head>
  <meta charset="utf-8">
  <title>The HTML5 Herald</title>
  <meta name="description" content="The HTML5 Herald">
  <meta name="author" content="SitePoint">
</head>
<body>

<p>Hello world.
<table><tr><td>I am a table</td></tr></table>
<pre>formatted</pre>

</body>
</html>

输出:

enter image description here

可能导致这种情况的原因是什么?

1 个答案:

答案 0 :(得分:1)

这是由于缺少依赖关系urw-fonts。安装完成后,转换后的文本是可读的。

为了清晰起见&amp;有关最低安装EL7的文档:

  1. 抓取wkhtmltopdf-amd二进制文件并解压缩到临时位置。

  2. 安装依赖项:yum install libXrender libXext fontconfig urw-fonts

  3. 使用wkhtmltopdf-amd -V测试二进制文件 - 这应该打印版本(截至今天为0.12.3)。

  4. 接下来测试它按预期转换文档。 wkhtmltopdf-amd http://google.com googlehomepage.pdf

  5. 如果输出PDF看起来不错,则将二进制文件复制到/usr/bin并完成调用。