乱码xml输出

时间:2013-02-24 14:16:36

标签: php xml

我正在尝试使用PHP解析xml Feed: http://trustbox.trustpilot.com/r/travelnation.co.uk.xml

访问它,它看起来完全没问题,但是当我尝试

<?php
$file = file_get_contents("http://trustbox.trustpilot.com/r/netamity.com.xml");
print_r($file);
?>

我得到了

‹•SÁŽÓ0=/ÿ`ŒÄmœ-  븊àèJV«••L«ŽmÙN²ý{Æi·M
...

怎么会出现乱码?使用simplexml它不会解析它(不出所料)。我已经尝试设置标头UTF-8标头,但我认为问题出在get_file_contents中。有什么想法吗?

1 个答案:

答案 0 :(得分:1)

内容看起来很“奇怪”,因为编码是压缩的(请参阅HTTP标头Content-Encoding: gzip)。

HTTP/1.1 200 OK
x-amz-id-2: 8wYarFnod0jtLJ3U8ZDN38102fjtG+EbwJjy0tY4YTZncrz9auEcQbzt1vyiSEhq
x-amz-request-id: A60F1E6CA5437776
Date: Sun, 24 Feb 2013 18:00:45 GMT
Content-Encoding: gzip
Last-Modified: Sun, 24 Feb 2013 05:19:11 GMT
ETag: "64eaa6f87768aeb3ae6741ba06318cb6"
Accept-Ranges: bytes
Content-Type: application/xhtml+xml
Content-Length: 52366
Server: AmazonS3

我想你需要知道如何通过HTTP读取文件;你可以尝试this one on SO