我正试图从文本中获取所有链接及其内容,但我的问题是链接可能还有其他属性,如类或ID。这个模式会是什么?
到目前为止我尝试的是:
/<a href="(.*)">(.*)<\/a\>/
谢谢你, 拉杜
答案 0 :(得分:3)
正如您对问题的评论所述,请避免使用HTML正则表达式。 正确方法是使用DOMDocument
$dom = new DOMDocument;
$dom->load($html);
$xpath = new DOMXPath($dom);
$links = $xpath->query('//*/a');
foreach ($links as $link) {
/* do something with this */
$href = $link->getAttribute('href');
$text = $link->nodeValue;
}
修改强>
答案 1 :(得分:0)