PHP cURL重定向到localhost

时间:2013-02-18 02:16:37

标签: php redirect curl login localhost

我正在尝试使用带有cURL的php脚本登录外部网页。我是cURL的新手,所以我觉得我错过了很多东西。我找到了一些示例并对其进行了修改以允许访问https页面。最终,我的目标是能够登录页面并在登录后通过指定的链接下载.csv。到目前为止,我所拥有的是一个测试登录页面的脚本;脚本如下所示:

$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, 'https://www.websiteurl.com/login');
curl_setopt($ch, CURLOPT_POSTFIELDS,'Email='.urlencode($login_email).'&Password='.urlencode($login_pass).'&submit=1');
curl_setopt($ch, CURLOPT_POST, true);
curl_setopt($ch, CURLOPT_HEADER, false);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true);
curl_setopt($ch, CURLOPT_COOKIEJAR, "cookie.txt");
curl_setopt($ch, CURLOPT_COOKIEFILE, "cookie.txt");
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_USERAGENT, "Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.8.1.3) Gecko/20070309 Firefox/2.0.0.3");
curl_setopt($ch, CURLOPT_REFERER, "https://www.websiteurl.com/login");
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false);
curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, false);
$output = curl_exec($ch);

我有几个问题。首先,有没有一个原因,它不会自行重定向?我查看页面内容的唯一方法是

echo $output

即使CURLOPT_RETURNTRANSFER和CURLOPT_FOLLOWLOCATION都设置为True。

其次,页面的URL保留在“localhost / folderName / test.php”,而不是指向实际的网站。谁能解释为什么会这样?因为脚本实际上没有重定向到登录的网页,所以我似乎无法做任何我需要做的事情。

我的问题与Cookie有关吗?我的cookies.txt文件与我的.php脚本位于同一个文件夹中。 (我正在使用wampServer btw)。它应该位于其他地方吗?

一旦我能够解决这两个问题,似乎我需要做的就是重定向到启动.csv文件下载过程的链接。

感谢您的帮助,非常感谢!

1 个答案:

答案 0 :(得分:2)

回答你问题的一部分:

来自http://php.net/manual/en/function.curl-setopt.php

  

CURLOPT_RETURNTRANSFER TRUE将传输作为字符串返回   返回curl_exec()的值,而不是直接输出。

换句话说 - 正是你所描述的。它将响应返回给字符串,然后您echo查看它。按要求......

  

-----编辑-----

至于问题的第二部分 - 当我将脚本的最后三行更改为

$output = curl_exec($ch);
header('Location:'.$website);
echo $output;

显示的页面地址更改为$website - 在我的情况下是我用来存储我的等效“https://www.websiteurl.com/login”的变量

我不确定这是你想做什么 - 因为我不确定我明白你接下来的步骤是什么。如果您被登录站点重定向,新地址不会成为返回标头的一部分吗?您是否需要提取该地址才能执行下一个请求(wget或其他)以下载您想要获取的文件?

为此,您需要将CURLOPT_HEADER设置为TRUE,

您可以从

获取最终到达的网址
$last_url = curl_getinfo($ch, CURLINFO_EFFECTIVE_URL); 

(见cURL , get redirect url to a variable)。

相同的链接还有一个有用的脚本,可以完全解析标题信息(在CURLOPT_HEADER==true时返回。这是nico limpica的答案。

底线:如果您将浏览器指向特定网站,则CURL会获取您的浏览器所收到的信息;这并不意味着您的浏览器的行为就像您将其指向该网站...