XPATH - 如何提取这个?

时间:2013-01-27 22:22:13

标签: php xpath

目标:获取锚链接(some_path)和锚值(用户名)的值,仅使用锚点ID(msg123456)作为起点。

HTML:

<!-- a lot of HTML code before this -->
<a id="msg123456"></a><a id="new"></a>
<div class="windowbg">
    <span class="topslice"><span></span></span>
    <div class="post_wrapper">
        <div class="poster">
            <h4><a href="some_path" title="some_user">User Name</a></h4>
        </div>
    </div>
</div>
<!-- a lot of HTML code after this -->

问题:我知道如何将XPATH用于简单的任务,但在这种情况下我不确定从哪里开始。

1 个答案:

答案 0 :(得分:0)

获取您可以搜索的锚标记,这仍然很容易。更困难的部分是找到下一个div,您可以使用following-sibling::div[1]在当前上下文之后的同一级别上获取第一个<div/>。之后的事情很容易。

路径:

//a[@id="msg123456"]/following-sibling::div[1]//a/@href/data()

对于用户名:

//a[@id="msg123456"]/following-sibling::div[1]//a/data()