这是html页面:
<div class="gs_ri">
<h3 class="gs_rt">
<span class="gs_ctc">
<span class="gs_ct1">[BOOK]</span>
<span class="gs_ct2">[B]</span></span>
<a href="http://example.com" onmousedown="">Title</a></h3>
<div class="gs_a">A</div>
<div class="gs_rs">B</div>
<div class="gs_fl"><a href="">C</a> <a href="">D</a> <a href=""</a></div></div></div>
<div class="gs_r"><div class="gs_ggs gs_fl"><button type="button" id="gs_ggsB2" class="gs_btnFI gs_in_ib gs_btn_half">
<span class="gs_wr"><span class="gs_bg"></span>
<span class="gs_lbl"></span>
<span class="gs_ico"></span></span></button>
<div class="gs_md_wp" id="gs_ggsW2"><a href="http://example.pdf" onmousedown=""
我对确定节点感到有点困惑。
我想得到http://example.com
和Title
我认为有两种方法可以获得它们:
它是<span>
:
foreach($html->find('span[class=gs_ctc2] ') as $link){
$link = $link->next_sibling();
echo $link->plaintext;
echo $link->href;
}
但它不起作用。
第二个,我把<h3 class="gs_rt">
作为父母,所以这是最后一个孩子的兄弟姐妹
foreach($html->find('h3[class=gs_rt] a') as $link){
$link = $link->last_child()->next_sibling();
echo $link->plaintext;
echo $link->href;
}
它也不起作用。我认为我还没有理解节点dom树。
答案 0 :(得分:1)
您不必选择兄弟姐妹。
使用h3[class=gs_rt] a
,您已经定位了相应的<a>
代码。所以只需从那里提取所需的值。但是,您可以按如下方式简化该选择器:
foreach($html->find('h3.gs_rt a') as $link){
echo $link->plaintext;
echo $link->href;
}
修改强>
关于评论,我认为,你想要的是这样的,但是我不确定你上面的代码是非常混乱(请使用适当的缩进!)
foreach($html->find('h3.gs_rt') as $block){
$link = $block->find( 'a' );
echo $link->plaintext;
echo $link->href;
$otherLink = $block->find( 'div[class=gs_md_wp] a' );
// do stuff with that $otherLink
}
答案 1 :(得分:0)
将id添加到href
<a id="myid" href="http://example.com" onmousedown="javascript:get_title('#myid')">Title</a></h3>
function get_title(i){
var h =$(i).attr('href');
var t =$(i).text();
alert('the link is (' + h + ' ) and the title is (' + t + ' )');
}