xpath检索包含标记的文本

时间:2017-02-15 18:56:00

标签: xpath

我尝试解析网页并获取名为div1的div标签内的所有内容。我试过了(' div [@class =" div1"]'),它给了我下面的内容

  <div class="div1">
                  <p>
                    something something <br>
                    abc<br>
                    def
                  </p>
              </div>

但是,我试图获取div标签内的所有内容,不包括div标签,如下所示

    <p>
                something something <br>
                abc<br>
                def
              </p>

2 个答案:

答案 0 :(得分:1)

尝试将xpath更改为

div[@class="div1"]/child::*

引自https://www.w3.org/TR/xpath/#location-paths

  

child::*选择上下文节点的所有子元素

答案 1 :(得分:0)

首先,当它是@class

时,你正在寻找@id