Web爬网-XPath-在div中查找特定标签的所有元素

时间:2018-09-21 11:09:38

标签: wordpress xpath web-scraping domxpath

我正在使用“ Scrapes” wordpress插件。

我想提取特定div中的所有段落。

<div id="main" class="col-md-9 col-sm-8">
 <div class="inside-post"> 
  <p>One</p>
  <p>Two</p>
  <p>Three</p>
 </div>
</div>

以下代码仅返回第一项:

//div[@id="main"]/div[contains(concat(" ", normalize-space(@class), " "), " inside-post ")]/p[1]

One

但是我要三个:

One
Two 
Three

请提供帮助。提前谢谢。

1 个答案:

答案 0 :(得分:2)

您的XPath专门选择第一个元素-ul.timeline > li:before { content: ''; background: #d4d9df; display: inline-block; position: absolute; left: -9px; width: 2px; height: 100%; z-index: 400 } ul.timeline > li { margin-bottom: 10px 0; padding-left: 10px; position: relative; } ul.timeline > li::after { content: ''; background: white; display: inline-block; position: absolute; border-radius: 50%; border: 2px solid #22c0e8; left: -20px; top: 0px; width: 20px; height: 20px; z-index: 400; } ul.timeline > li:last-child:before{ display:none; } ul.timeline > li > p{ margin-top: 0px; padding-top: 0px; } ul.timeline > li > p + p{ margin-bottom: 0px; margin-top: 0em; padding-top: 0px; padding-bottom: 1em; } 。如果删除/p[1],则应选择所有[1]元素。

尝试

p