如何在pdftk

时间:2018-06-04 19:31:09

标签: pdf pdftk

pdftk让您使用以下命令设置PDF的标题:

pdftk input.pdf update_info metadata.txt output output.pdf

但是,如果我在metadata.txt文件中使用特殊字符(例如德语字符或中文字符),那么它似乎不起作用。

以下是更改标题的示例:

InfoBegin
InfoKey: Title
InfoValue: Fingerspitzengefühl is a German term.

但是,PDF最终会以ü

的奇怪字符结束

documentation of pdftk中,它表示非ASCII字符应编码为XML数字实体。但是,我用Google搜索自己很傻但找不到任何有用的东西。

1 个答案:

答案 0 :(得分:1)

我发现的最佳参考是Numerical Character Reference,它适用于XML(以及XHTML和SGML)。

这通常用于表示不可直接编码的字符。

在您的情况下,字符为U + 252,ü,可以用ü(十进制),&0374;(八进制)或ü(十六进制)替换)。

使用小数引用,您的文件应编码为:

InfoBegin
InfoKey: Title
InfoValue: Fingerspitzengefühl is a German term.

注意:

如果您使用的是Nix,则可以使用recode对文件进行编码。

% cat metadata.txt | recode ..xml