从url解析js css和img源代码

时间:2013-03-17 06:00:51

标签: php parsing

我想从网址获取所有javascript,css和图片来源。我正在使用简单的dom解析。这是我目前的代码:

加载网址:

   $html = file_get_html($n);

解析javascript来源:

foreach($html->find('script') as $element){ 
    $value = $element->src;
        if ($value != null){        
            if (strpos($value, '//') === 0) {
            } else {
                if(filter_var($value, FILTER_VALIDATE_URL)){
                  $array[] = strip_tags($value);
                } 
                else {
                  $array[] = strip_tags($n.$value);  
                }       
            }
        }
    }

解析图像来源:

foreach($html->find('img') as $element){ 
    $value = $element->src;
        if ($value != null){
            if (strpos($value, '//') === 0) {
            } else {        
                if(filter_var($value, FILTER_VALIDATE_URL)){
                  $array[] = strip_tags($value);
                } 
                else {
                  $array[] = strip_tags($n.$value);
                }
            }
        }
    }

解析css来源:

foreach($html->find('link') as $element){ 
    $value = $element->href;
        if ($value != null){
            if (strpos($value, '//') === 0) {
            } else {    
                if(filter_var($value, FILTER_VALIDATE_URL)){
                  $array[] = strip_tags($value);
                } 
                else {
                  $array[] = strip_tags($n.$value);
                }
            }
        }
    }

我唯一的问题是解析css,我想使用这样的东西 - foreach($html->find('link rel="stylesheet"') as $element),但它没有那样工作。是否有更好(更准确或更恰当)的方法来解析这些东西?

1 个答案:

答案 0 :(得分:0)

试试这个:$html->find('link[rel=stylesheet]')