我打算写一个解析器来获取网站上的信息。
不管这个网站出了什么问题,我收到这些信息并把它放在一个档案中,这都是胡言乱语。
该网站是anidb.net
有谁可以告诉我为什么我会乱搞而不是HTML?
我的代码
<?php
$url = 'http://anidb.net/perl-bin/animedb.pl?show=anime&aid=854';
file_put_contents("file.txt", file_get_contents($url));
?>
我还要补充一点,使用浏览器的View Source功能,我会看到HTML。
答案 0 :(得分:5)
我检查了您指定的页面上的标题,然后返回:
Content-Encoding: gzip
这意味着你所看到的'乱码'确实是gzip编码的。这是另一个应该帮助你的线程: Decode gzipped web page retrieved via cURL in PHP