我正在寻找一个库,类,函数等,我可以为它提供一串html并找到像src或href这样的东西。我知道我可以找到针对特定情况的正则表达式,但我正在寻找一个库,这样可以轻松获取内容,而无需每次都找出新的正则表达式。
答案 0 :(得分:1)
SimpleHTMLDOM是您的朋友。 REGEX绝不是最好的方法(对于HTML标记)。
示例:
$html = file_get_html('http://www.google.com/');
// Find all images
foreach($html->find('img') as $element) {
echo $element->src . '<br>'; # givs you the image 'src' attribute for each image on that page.
}
答案 1 :(得分:1)
假设您使用的是PHP5,DOMDocument类中已经可以使用它: