为什么php curl url会自动将我自己从php文件重定向到url?

时间:2017-03-09 07:37:43

标签: php curl

我正在尝试从网站中提取数据,但是当我加载php文件时,我会自动重定向到网站..!

这里看一下视频: http://recordit.co/KOwXS5KTKR

PHP:

$url = "http://extratorrent.cc/view/popular/TV.html?page=1&srt=seeds&pp=50&order=desc";

 $ch = curl_init();

    curl_setopt($ch, CURLOPT_AUTOREFERER, TRUE);
    curl_setopt($ch, CURLOPT_HEADER, 0);
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
    curl_setopt($ch, CURLOPT_URL, $url);
    curl_setopt($ch, CURLOPT_FOLLOWLOCATION, FALSE);       

    $data = curl_exec($ch);
    curl_close($ch);

print_r($data);

JUST ASSUMING:

在查看网站源代码页代码时,我将JavaScript视为:

<script type="text/javascript">window.functions = new Array();</script>
<script src="https://extra.to/scripts/script.js?2" type="text/javascript"></script>

我认为这可能会导致重定向,所以如果这是正确的那么我怎么能阻止它?

我做了一些研究,结果是window.location无法完全禁用,因此网站不会自行重定向...我想知道如果我可以忽略加载通过PHP加载CURL页面的HTML中的以下代码?

1 个答案:

答案 0 :(得分:0)

肯定会有一个Javascript来检查你的window.location与extratorrent域名和IP。虽然我找不到自行重定向的行,但它必须在某处。

print_r

如果要从此站点提取数据,则应考虑是否需要按str_replace输出数据。如果您处理内容,则在输出之前它不会影响您的页面。你可以尝试:

  1. 在您的浏览器中禁用Javascript以进行开发(可能会也可能不会,这取决于网站对JS的依赖性)。

  2. 从卷曲响应中删除脚本,即使是简单的serialize

  3. 处理/解析内容而不将其输出到浏览器。