我正在编写一个需要在页面上挑选某些URL的脚本;例如,这些网址可以是http://fiel.com/989898/etc.html
,后跟">load</a>
我如何使用正则表达式提取这些?
答案 0 :(得分:0)
在javascript中:
var links = document.links;
for (var i=0; i<links.length; i++) {
if(links[i].match(/http\:\/\/fiel\.com/i))
{
}
}
在php中
$html = '<html><body>....</body></html>';
$doc = new DOMDocument();
@$doc->loadHTML($html);
$links = $doc->getElementsByTagName('a');
foreach ($links as $link) {
if ($link->nodeValue == 'load') {
$data = $link->getAttribute('href');
//do whatever with href
}
}