从页面的源代码解析图像URL

时间:2013-12-12 12:32:19

标签: php regex

这是我的正则表达式,以获取页面上的图像网址。

<?php       
        $url = $_POST['url'];       
        $data = file_get_contents($url);    
        $logo = get_logo($data);
        function get_logo($html) 
            {
                preg_match_all('/\bhttps?:\/\/\S+(?:png|jpg)\b/', $html, $matches);
                //echo "mactch : $matches[0][0]";
                return $matches[0][0];  
            }

?>

正则表达式中是否有任何遗漏?对于某些网址,它虽然有图像,但它不会提供图片网址。

例如:http://www.milanart.in/

它不会在该页面上显示图像。

请不要穹顶。我无法使用它。

2 个答案:

答案 0 :(得分:1)

<?php       
    $url = "http://www.milanart.in";       
    $data = file_get_contents($url);  
    $logo = get_logo($data);

    function get_logo($html) 
        {
            preg_match_all("/<img src=\"(.*?)\"/", $html, $matches);
            return $matches[1][0];  
        }
    echo 'logo path : '.$logo;
    echo '<img src="'.$url.'/'.$logo.'" />';
?>

答案 1 :(得分:1)

使用DOM的PHP类来获取所有图像:

  1. 在CSS中搜索图像文件..... url(imagefilename.extension)
  2. 以HTML格式搜索图片文件......