pdftk让您使用以下命令设置PDF的标题:
pdftk input.pdf update_info metadata.txt output output.pdf
但是,如果我在metadata.txt文件中使用特殊字符(例如德语字符或中文字符),那么它似乎不起作用。
以下是更改标题的示例:
InfoBegin
InfoKey: Title
InfoValue: Fingerspitzengefühl is a German term.
但是,PDF最终会以ü
的奇怪字符结束在documentation of pdftk中,它表示非ASCII字符应编码为XML数字实体。但是,我用Google搜索自己很傻但找不到任何有用的东西。
答案 0 :(得分:1)
我发现的最佳参考是Numerical Character Reference,它适用于XML(以及XHTML和SGML)。
这通常用于表示不可直接编码的字符。
在您的情况下,字符为U + 252,ü
,可以用ü
(十进制),&0374;
(八进制)或ü
(十六进制)替换)。
使用小数引用,您的文件应编码为:
InfoBegin
InfoKey: Title
InfoValue: Fingerspitzengefühl is a German term.
注意:强>
如果您使用的是Nix,则可以使用recode
对文件进行编码。
% cat metadata.txt | recode ..xml