目标:获取锚链接(some_path)和锚值(用户名)的值,仅使用锚点ID(msg123456)作为起点。
HTML:
<!-- a lot of HTML code before this -->
<a id="msg123456"></a><a id="new"></a>
<div class="windowbg">
<span class="topslice"><span></span></span>
<div class="post_wrapper">
<div class="poster">
<h4><a href="some_path" title="some_user">User Name</a></h4>
</div>
</div>
</div>
<!-- a lot of HTML code after this -->
问题:我知道如何将XPATH用于简单的任务,但在这种情况下我不确定从哪里开始。
答案 0 :(得分:0)
获取您可以搜索的锚标记,这仍然很容易。更困难的部分是找到下一个div,您可以使用following-sibling::div[1]
在当前上下文之后的同一级别上获取第一个<div/>
。之后的事情很容易。
路径:
//a[@id="msg123456"]/following-sibling::div[1]//a/@href/data()
对于用户名:
//a[@id="msg123456"]/following-sibling::div[1]//a/data()