wkhtmltopdf html url encoding(german umlaut)

时间:2015-03-24 09:51:27

标签: encoding utf-8 wkhtmltopdf

Linux控制台上的以下.pdf转换编码失败,出现“ContentNotFoundError”

wkhtmltopdf --page-size A4 --encoding utf-8 --viewport-size 1024x768 http://localhost/möja.html /tmp/test.pdf

启用了UTF-8字符集的lynx中的相同问题:

The requested URL /möja.html was not found on this server.

语言环境设置为utf-8。控制台正确输入德语特殊字符。

LANG=de_DE.UTF-8
LANGUAGE=
LC_CTYPE="de_DE.UTF-8"
LC_NUMERIC="de_DE.UTF-8"
LC_TIME="de_DE.UTF-8"
LC_COLLATE="de_DE.UTF-8"
LC_MONETARY="de_DE.UTF-8"
LC_MESSAGES="de_DE.UTF-8"
LC_PAPER="de_DE.UTF-8"
LC_NAME="de_DE.UTF-8"
LC_ADDRESS="de_DE.UTF-8"
LC_TELEPHONE="de_DE.UTF-8"
LC_MEASUREMENT="de_DE.UTF-8"
LC_IDENTIFICATION="de_DE.UTF-8"
LC_ALL=

通过浏览器访问页面并在开发系统上使用wkhtmltopdf(相同的debian wheezy发行版)按预期工作。如果网址中没有德语特殊字符,pdf将会很好地创建。我找不到任何差异。

感谢您的每一个提示!

1 个答案:

答案 0 :(得分:0)

显然服务器不希望看到UTF-8编码的字符,它可能需要Latin-1。 URL不能包含非ASCII字符。根据预期的字符编码,以百分比编码对URL中的变音符号进行编码。 Latin-1(ISO-8859-1)百分比编码版本将是:

http://localhost/k%F6nig.html