cURL返回二进制数据而不是html

时间:2015-02-02 17:58:07

标签: php ssl curl https

function curl($url) {

$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_USERAGENT, "Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.8.1.1) Gecko/20061204 Firefox/25.0.1");
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_COOKIE, 'long cookie here');
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true);
$output = curl_exec($ch);
curl_close($ch);
return $output;

}

我提供的原始网址是http://example.com/i-123.html,但如果我在浏览器中打开,我会被重定向到https://example.com/item-description-123.html(因此我添加了CURLOPT_FOLLOWLOCATION)。

但是,此函数的输出是二进制数据。

1f8b 0800 0000 0000 0003 ed7d e976 db38
f2ef e7f8 2930 9ac9 d86e 9b92 b868 f3a2
3e5e 9374 67fb c7ee 74f7 e4e6 f880 2428
31a6 4835 172f 3dd3 8f74 3fde 17b8 f7c5
6e15 008a 8ba8 2db1 3ce9 25a7 dba4 4810
......

我该如何解决这个问题?我尝试添加

curl_setopt($curl, CURLOPT_SSL_VERIFYPEER, FALSE);
curl_setopt($curl, CURLOPT_SSL_VERIFYHOST, 2); 

(从某处复制)。没有工作。

file_get_contents()给了我相同的输出。

1 个答案:

答案 0 :(得分:9)

嗯,解决方案很可悲......

使用wget -S http://example.com我发现内容已被压缩(gzip)。使用gunzip我成功提取了html。

还添加到我原来的PHP脚本

curl_setopt($ch,CURLOPT_ENCODING , "");

它就像一个魅力。