我正在尝试从网址解析html。我这样做:
$html = file_get_contents($someURL);
echo $html;
但是当我运行该脚本时,页面会显示:
UISCGI (software8a-web; software8a-link):
This site is best viewed with Netscape 4.6 or 4.7 or Internet Explorer 5 and greater.
At this time Netscape 6 is not supported for Link usage.
我还尝试了CURLing url,同时伪造IE7作为用户代理。
这里出了什么问题?我无法在Google的任何地方找到此错误。如何解决此系统错误?
答案 0 :(得分:0)
我找到了这样的地址,用户代理的伪造工作正常。在你的情况下,标题的设置可能是错误的。
简单的例子:
<?php
//fake IE6
ini_set('user_agent', "Mozilla/4.0 (compatible; MSIE 6.0)\r\n");
//request
echo file_get_contents('http://www.bu.edu/link/');
?>
(没有ini_set()我得到的输出和你一样)
注意:从PHP5开始,file_get_contents()也允许通过可选的context-parameter设置头文件 -