file_get_content得到错误的网站

时间:2013-08-21 15:47:26

标签: php web-crawler

我正在学习用PHP创建蜘蛛网站内容 - file_get_contents,但是出了点问题。我想要的网址是“http://www.jandan.net”。

但是使用file_get_content(),我从“http://i.jandan.net”获取内容(它是电话页面,它们是不同的页面)。 user_agent也无法使用。

<?php
ini_set("user_agent","Mozilla/5.0 (X11; U; Linux x86_64; en-US; rv:1.9.2) Gecko/20100301 Ubuntu/9.10 (karmic) Firefox/3.6");
$url = 'http://www.jandan.net/';
/*
$opt = array( 'http'=>array(
'method'=>"GET",
'header'=>"User-Agent: Mozilla/5.0\n"
)
);
$context = stream_context_create($opt);
*/
$content = file_get_contents($url);
echo var_dump($content);
?>

1 个答案:

答案 0 :(得分:0)

$content = file_get_contents($url,);中的逗号导致问题。

----------------------------------------------- -------------------------- ^

来自original posted code --- ^

保留逗号会产生以下错误消息:

  

解析错误:语法错误,意外')'在......(文件夹路径等)

快速记录:使用$url = 'http://i.jandan.net/';也有效,显示了内容。

试试这个:

<?php
ini_set("user_agent","Mozilla/5.0 (X11; U; Linux x86_64; en-US; rv:1.9.2) Gecko/20100301 Ubuntu/9.10 (karmic) Firefox/3.6");
$url = 'http://www.jandan.net/';

/*
$opt = array( 'http'=>array(
'method'=>"GET",
'header'=>"User-Agent: Mozilla/5.0\n"
)
);
$context = stream_context_create($opt);
*/
$content = file_get_contents($url);
echo var_dump($content);
// echo $content;
?>