使用SimpleXML解析á等有趣的角色

时间:2012-06-27 13:53:59

标签: php character-encoding xml-parsing simplexml

在接收和编写我的XML时,有些字段会像这样:Benedíková

但是当我用

之类的代码解析它时
$xml = simplexml_load_file($filename); 
print_r($xml);

......该字段更改为:

Benedíková

如何干净地解析它以保留á或í等字符?

1 个答案:

答案 0 :(得分:0)

正如PHP手册中记录的那样,当您从SimpleXMLElement中读取字符串时,始终使用UTF-8编码使用Unicode。

这与文档中使用的编码无关。

因此,如果您的网站不使用UTF-8作为编码,您可能希望切换到,您可能需要将这些UTF-8字符串重新编码为您网站的编码。

我通常建议第一个(将网站转换为使用UTF-8),但并不总是很容易改变它(并不总是正确的做法),因此两种变体都有其用途。

参见: