我正在使用XFDF文件用PHP和pdftk填写PDF格式的服务器端,但我的问题是没有非英文字符(ä,ö,å等)打印到表单字段。
这是我用来解析XFDF文件的函数:
function createFDF($file,$info,$enc='UTF-8'){
$data='<?xml version="1.0" encoding="'.$enc.'"?>'."\n".
'<xfdf xmlns="http://ns.adobe.com/xfdf/" xml:space="preserve">'."\n".
'<fields>'."\n";
foreach($info as $field => $val){
$data.='<field name="'.$field.'">'."\n";
if(is_array($val)){
foreach($val as $opt)
$data.='<value>'.htmlentities($opt,ENT_COMPAT,$enc).'</value>'."\n";
}else{
$data.='<value>'.htmlentities($val,ENT_COMPAT,$enc).'</value>'."\n";
}
$data.='</field>'."\n";
}
$data.='</fields>'."\n".
'<ids original="'.md5($file).'" modified="'.time().'" />'."\n".
'<f href="'.$file.'" />'."\n".
'</xfdf>'."\n";
return $data;
生成的XFDF文件如下所示:
<?xml version="1.0" encoding="UTF-8"?>
<xfdf xmlns="http://ns.adobe.com/xfdf/" xml:space="preserve">
<fields>
<field name="loadman-pudotuspainolaitteen-mittaustulosten-tallenne">
<value>1201</value>
</field>
<field name="tutkittavarakenne-rivi1">
<value>a</value>
</field>
<field name="tutkittavarakenne-rivi2">
<value></value>
</field>
<field name="tutk-pvm">
<value>11.12.2012</value>
</field>
<field name="mittauksen_suorittaja">
<value>o</value>
</field>
<field name="vast-tyonjohtaja">
<value>ö</value>
</field>
<field name="rakennemateriaali">
<value>ä</value>
</field>
<field name="laatuvaatimukset">
<value>å</value>
</field>
<field name="mittauspaikan_tiivistysmenetelma">
<value>á</value>
</field>
<field name="pohjalevy">
<value>é</value>
</field>
<field name="pohjamaa-alusrakenne">
<value>í</value>
</field>
<field name="mittauspaikan-tiivistysmenetelma">
<value>è</value>
</field>
<field name="emoduli">
<value>ö</value>
</field>
<field name="tiiveys">
<value>öä</value>
</field>
<field name="huomautukset_ja_loppupaatelmat1">
<value>öä</value>
</field>
<field name="huomautukset_ja_loppupaatelmat2">
<value>öä</value>
</field>
<field name="huomautukset_ja_loppupaatelmat3">
<value>öä</value>
</field>
<field name="empa1">
<value>ö</value>
</field>
<field name="empa1-e">
<value>ö</value>
</field>
<field name="empa2">
<value>ö</value>
</field>
<field name="empa2-e">
<value>ö</value>
</field>
<field name="allekirjoitus">
<value>Einomies Porkkakoski</value>
</field>
</fields>
<ids original="84b0ff7a04b017303be186faa0d1254a" modified="1343290963" />
<f href="assets/loadman.pdf" />
</xfdf>
带有英文字母的字段打印完美,但带有尖锐,坟墓或斯堪的纳维亚语的字母不会转移到PDF文件。 EXCEPT 由于某种原因
<field name="huomautukset_ja_loppupaatelmat1">
<value>öä</value>
</field>
完美运作并打印öä!
我运行的命令是
pdftk <pdf-file> fill_form <xfdf-file> output <output file> flatten
这不会导致任何错误。
我正在使用Debian 6.0,PHP 5.3.3-7 + squeeze13而pdftk版本是1.44-5
更新我注意到,如果我不压平生成的文件并将其打开,则字段在激活字段时会正确打印,但在字段未聚焦时会再次隐藏。如果我手动输入文件中的任何内容,特殊字符也会显示。保存并重新打开的文件但不显示文本,除非再添加一些文本。
更新2 修好了该死的东西。最初的表格是在OSX Snow Leopard上使用Adobe Acrobat Pro制作的。现在我使用LibreOffice + Oracle PDF Import插件重新制作表单,一切似乎都在运行!
答案 0 :(得分:2)
如果您使用以下列表,我认为您会有更多的运气:
Ä
代表Ä(而不是Ä
)Å
代表Å(代替Å
)Ö
代表Ö(代替Ö
)Ü
代表Ü(而不是Ü
)ß
代表ß(而不是ß
)ä
代表ä(代替ä
)å
代表å(而不是å
)ö
代表ö(而不是ö
)ü
代表ü(而不是ü
)我会让你自己找出如何扩展该列表,直到它达到完整性: - )
答案 1 :(得分:2)
这是因为您在PHP脚本中使用htmlentities
。这会将重音符号转换为&xxxx;
将您的XML编码设置为iso-8859-1
或WINDOWS-1252
,并在PHP脚本中省略htmlentities
要尝试的另一件事是使用 utf8_encode
而不是 htmlentities
(而不是修改XML编码)
答案 2 :(得分:0)
为了支持任何UTF-8字符,我写了Pdf FormFiller UTF-8:http://sourceforge.net/projects/pdfformfiller2/