使用PHP从网页抓取信息

时间:2013-12-03 22:13:50

标签: php html

是否可以使用PHP抓取网页而无需下载某种PHP库或扩展程序?

现在,我可以使用PHP抓取来自网站的元标记:

$tags = get_meta_tags('www.example.com/');

echo $tags['author'];       // name
echo $tags['description'];  // description

是否有类似的方法可以从任何指定网站获取此标记中的href信息:

<link rel="img_src" href="image.png"/>

我希望能够用PHP完成它。

谢谢!

2 个答案:

答案 0 :(得分:3)

尝试file_get_contents功能。例如:

<?php 

$data = file_get_contents('www.example.com');
$regex = '/Search Pattern/';
preg_match($regex,$data,$match);
var_dump($match); 
echo $match[1];

?>

您也可以使用cURL库 - http://php.net/manual/en/book.curl.php

答案 1 :(得分:0)

使用curl获得更多高级功能。您将能够访问标题,重定向等。PHP Curl

<?php 
    $c = curl_init();

    // set some options
    curl_setopt($c, CURLOPT_URL, "google.com"); 
    curl_setopt($c, CURLOPT_RETURNTRANSFER, 1); 

    $data = curl_exec($c); 


    curl_close($c);      
?>