我有一个PHP应用程序需要从另一个网页抓取内容,而我正在阅读的网页需要一个cookie。
我已经找到了有关如何使用cookie(http://groups.google.com/group/comp.lang.php/msg/4f618114ab15ae2a)后如何进行此调用的信息,但是我不知道如何生成cookie,或者保存cookie的方式/位置。
例如,要通过wget阅读此网页,请执行以下操作:
wget --quiet --save-cookies cookie.file --output-document=who.cares \
http://remoteServer/login.php?user=xxx&pass=yyy
wget --quiet --load-cookies cookie.file --output-document=documentiwant.html \
http://remoteServer/pageicareabout.html
...我的问题是如何在PHP中执行'--save-cookies'位,以便我可以在后续PHP stream_context_create / file_get_contents块中使用cookie:
$opts = array(http'=> array(
'method'=> "GET",
'header'=>
"Accept-language: en\r\n" .
"Cookie: **NoClueAtAll**\r\n"
)
);
$context = stream_context_create($opts);
$documentiwant = file_get_contents("http://remoteServer/pageicareabout.html",
0, $context);
答案 0 :(得分:14)
Shazam - 有效!太多了!如果其他人偶然发现这个页面,这里需要详细说明:
改变了 先前列出的PHP如下:
<?php
$cr = curl_init('http://remoteServer/login.php?user=xxx&pass=yyy');
curl_setopt($cr, CURLOPT_RETURNTRANSFER, true);
curl_setopt($cr, CURLOPT_COOKIEJAR, 'cookie.txt');
$whoCares = curl_exec($cr);
curl_close($cr);
$cr = curl_init('http://remoteServer/pageicareabout.html');
curl_setopt($cr, CURLOPT_RETURNTRANSFER, true);
curl_setopt($cr, CURLOPT_COOKIEFILE, 'cookie.txt');
$documentiwant = curl_exec($cr);
curl_close($cr);
?>
以上代码段受http://www.weberdev.com/get_example-4555.html的影响很大。
答案 1 :(得分:5)
使用cURL可能会更好。 使用curl_setopt设置Cookie处理选项。
如果这只是一次性的事情,您可以使用带Live HTTP Headers的Firefox来获取标题,然后将其粘贴到您的PHP代码中。