使用cURL检索最新版本的页面

时间:2013-11-14 15:26:22

标签: php cookies curl

我的网站从其他网站上拉并发布时间表 - 使用cURL检索。时间表每天都会更改,但是,除非我删除服务器上的cookie文件,否则最新版本的计划不会发布到我的站点,因此我认为cookie需要更新,但它不会发生。< / p>

额外信息:cookie文件具有权限644;我假设它可以被读/写为cURL创建文件,如果它不存在。

感谢您的帮助!

代码:

<?php
$login_url = 'https://example.com';

//These are the post data username and password
$post_data = 'username=user&password=password&external_login=0&action=login';

//Create a curl object
$ch = curl_init();

//Set the useragent
$agent = $_SERVER["HTTP_USER_AGENT"];
curl_setopt($ch, CURLOPT_USERAGENT, $agent);

//Set the URL
curl_setopt($ch, CURLOPT_URL, $login_url );

//This is a POST query
curl_setopt($ch, CURLOPT_POST, 1 );

curl_setopt ($ch, CURLOPT_SSL_VERIFYPEER, FALSE);

//Set the post data
curl_setopt($ch, CURLOPT_POSTFIELDS, $post_data);

//We want the content after the query
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);

//Follow Location redirects
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);

/*
Set the cookie storing files
Cookie files are necessary since we are logging and session data needs to be saved
*/

curl_setopt($ch, CURLOPT_COOKIEJAR, 'cookie.txt');
curl_setopt($ch, CURLOPT_COOKIEFILE, 'cookie.txt');

//Execute the action to login
$postResult = curl_exec($ch);

$geturl='https://example.com/schedule';

curl_setopt($ch, CURLOPT_URL, $geturl);
curl_exec($ch);

if(curl_exec($ch) === false)
{
echo 'Error: ' . curl_error($ch);
}

curl_setopt($ch, CURLOPT_URL, $geturl);

$schedule = curl_exec($ch);

echo $schedule;

curl_close($ch);

?>

以下是cookie文件的内容:

# Netscape HTTP Cookie File
# http://curl.haxx.se/rfc/cookie_spec.html
# This file was generated by libcurl! Edit at your own risk.

example.com FALSE   /   FALSE   0   code1234    codexxxxxxxxxx
example.com FALSE   /id/    FALSE   12345678    display_mobile_version_1620 0

2 个答案:

答案 0 :(得分:1)

加     curl_setopt($ ch,CURLOPT_COOKIESESSION,TRUE); 以上,现在的时间表正在拉动最新的版本。

答案 1 :(得分:0)

您可以尝试使用CURLOPT_FRESH_CONNECT TRUE强制使用新连接。

curl_setopt($curl1, CURLOPT_FRESH_CONNECT, TRUE);

但是,我很好奇,你的文件中包含了哪些cookie。