我想在第一个<img>
标记之后获取所有<h1>
个标记,但我无法确定如何。
目前,我可以使用以下代码从网页获取所有<img>
代码:
$html = file_get_contents($this->url);
$this->doc = new DOMDocument();
@$this->doc->loadHTML($html);
$tags = $this->doc->getElementsByTagName('img');
foreach ($tags as $tag) {
array_push($this->images, $tag->getAttribute('src'));
}
如何在第一个<h1>
标记 后执行此操作?
答案 0 :(得分:0)
对于php获取一个dom解析器。 http://simplehtmldom.sourceforge.net/manual.htm#section_traverse
找到h1标签然后使用遍历兄弟搜索img标签。
$ es = $ html-&gt; find('h1')
foreach($es->next_sibling() as $sibling)
{
foreach($sibling->find( 'img' ) as $img )
{
// do something...
}
}