我想从网址获取所有javascript,css和图片来源。我正在使用简单的dom解析。这是我目前的代码:
加载网址:
$html = file_get_html($n);
解析javascript来源:
foreach($html->find('script') as $element){
$value = $element->src;
if ($value != null){
if (strpos($value, '//') === 0) {
} else {
if(filter_var($value, FILTER_VALIDATE_URL)){
$array[] = strip_tags($value);
}
else {
$array[] = strip_tags($n.$value);
}
}
}
}
解析图像来源:
foreach($html->find('img') as $element){
$value = $element->src;
if ($value != null){
if (strpos($value, '//') === 0) {
} else {
if(filter_var($value, FILTER_VALIDATE_URL)){
$array[] = strip_tags($value);
}
else {
$array[] = strip_tags($n.$value);
}
}
}
}
解析css来源:
foreach($html->find('link') as $element){
$value = $element->href;
if ($value != null){
if (strpos($value, '//') === 0) {
} else {
if(filter_var($value, FILTER_VALIDATE_URL)){
$array[] = strip_tags($value);
}
else {
$array[] = strip_tags($n.$value);
}
}
}
}
我唯一的问题是解析css,我想使用这样的东西 - foreach($html->find('link rel="stylesheet"') as $element)
,但它没有那样工作。是否有更好(更准确或更恰当)的方法来解析这些东西?
答案 0 :(得分:0)
试试这个:$html->find('link[rel=stylesheet]')