我正在尝试从网站中提取数据,但是当我加载php文件时,我会自动重定向到网站..!
这里看一下视频: http://recordit.co/KOwXS5KTKR
PHP:
$url = "http://extratorrent.cc/view/popular/TV.html?page=1&srt=seeds&pp=50&order=desc";
$ch = curl_init();
curl_setopt($ch, CURLOPT_AUTOREFERER, TRUE);
curl_setopt($ch, CURLOPT_HEADER, 0);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, FALSE);
$data = curl_exec($ch);
curl_close($ch);
print_r($data);
JUST ASSUMING:
在查看网站源代码页代码时,我将JavaScript视为:
<script type="text/javascript">window.functions = new Array();</script>
<script src="https://extra.to/scripts/script.js?2" type="text/javascript"></script>
我认为这可能会导致重定向,所以如果这是正确的那么我怎么能阻止它?
我做了一些研究,结果是window.location
无法完全禁用,因此网站不会自行重定向...我想知道如果我可以忽略加载通过PHP加载CURL页面的HTML中的以下代码?
答案 0 :(得分:0)
肯定会有一个Javascript来检查你的window.location与extratorrent域名和IP。虽然我找不到自行重定向的行,但它必须在某处。
print_r
如果要从此站点提取数据,则应考虑是否需要按str_replace
输出数据。如果您处理内容,则在输出之前它不会影响您的页面。你可以尝试:
在您的浏览器中禁用Javascript以进行开发(可能会也可能不会,这取决于网站对JS的依赖性)。
从卷曲响应中删除脚本,即使是简单的serialize
。
处理/解析内容而不将其输出到浏览器。