PHP - file_get_contents系统错误?

时间:2010-12-26 08:14:07

标签: php html parsing

我正在尝试从网址解析html。我这样做:

$html = file_get_contents($someURL);
echo $html;

但是当我运行该脚本时,页面会显示:

UISCGI (software8a-web; software8a-link):
This site is best viewed with Netscape 4.6 or 4.7 or Internet Explorer 5 and greater.
At this time Netscape 6 is not supported for Link usage.

我还尝试了CURLing url,同时伪造IE7作为用户代理。

这里出了什么问题?我无法在Google的任何地方找到此错误。如何解决此系统错误?

1 个答案:

答案 0 :(得分:0)

我找到了这样的地址,用户代理的伪造工作正常。在你的情况下,标题的设置可能是错误的。

简单的例子:

<?php
   //fake IE6
  ini_set('user_agent', "Mozilla/4.0 (compatible; MSIE 6.0)\r\n");
   //request
  echo file_get_contents('http://www.bu.edu/link/');
?>

(没有ini_set()我得到的输出和你一样)

注意:从PHP5开始,file_get_contents()也允许通过可选的context-parameter设置头文件 -