我正在尝试通过此代码获取页面,但未成功。
在抓投掷重定向之后(由JS执行)。
$url = 'https://www.microsoft.com/en-us/wdsi/threats/malware-encyclopedia-description?Name=Trojan:Win32/Speesipro.A';
echo getPage($url);
function getPage($url) {
$ch = curl_init();
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, FALSE);
curl_setopt($ch, CURLOPT_HEADER, true);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true);
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_REFERER, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, TRUE);
$result = curl_exec($ch);
curl_close($ch);
return $result;
}
我该怎么做才能在没有重定向的情况下按网址获取页面?
答案 0 :(得分:0)
为避免重定向,只需将这行代码添加到脚本中以替换最后一行
//返回$ result;
return str_replace("https://c.s-microsoft.com/en-us/CMSScripts/script.jsx","",$result);
}
因此,加载的javascript不会将加载的页面重定向到无效的URL。
请检查并告诉我是否有帮助。