我正在抓取一个html页面,该页面在div元素class="page-title"
id="row-1"
的实例数量
所以我们有类似的东西:
<div id="row-1">
<div class="page-title">
<span><h4><a>text I want to grab</a></h4></span>
</div>
</div>
这些行中可能有1,2,3,10行。任何人都可以帮助解释如果有多行我如何抓取页面标题的每个实例?
答案 0 :(得分:3)
无论你做什么,都不要使用正则表达式! HE COMES
相反,请使用解析器:
$dom = new DOMDocument();
$dom->loadHTML($your_html_source_here);
$xpath = new DOMXPath($dom);
$nodes = $xpath->query("//*[@id='row-1']/div[@class='page-title']");