某些URL的正则表达式匹配

时间:2011-09-01 20:39:38

标签: regex

我正在编写一个需要在页面上挑选某些URL的脚本;例如,这些网址可以是http://fiel.com/989898/etc.html,后跟">load</a>

我如何使用正则表达式提取这些?

1 个答案:

答案 0 :(得分:0)

在javascript中:

var links = document.links;
for (var i=0; i<links.length; i++) {
  if(links[i].match(/http\:\/\/fiel\.com/i)) 
  {
  }
}

在php中

$html = '<html><body>....</body></html>';
$doc = new DOMDocument();
@$doc->loadHTML($html);
$links = $doc->getElementsByTagName('a');
foreach ($links as $link) {
    if ($link->nodeValue == 'load') {
          $data = $link->getAttribute('href');
          //do whatever with href
    }
}