Xpath - 尝试获取不在特定div下的所有li对象。

时间:2017-05-31 14:26:09

标签: xpath rvest

我试图从以下页面进入: https://ideas.repec.org/a/aea/aecrev/v92y2002i3p411-433.html 参考文献清单。

为了这样我试着抓住所有的" li" div下的元素" references-body"。

正如您所看到的,在某些情况下,列表中包含旧版本或其他版本的参考。我不想要那些。

我使用以下代码 - 但它似乎无法正常工作 有什么帮助吗?

//div[@id="references-body"]//li[not(ancestor::div[@class="otherversion" or 
@class="publishedas"]) and (@class="downfree" or @class="downgate" or 
@class="downnone")]

谢谢!

1 个答案:

答案 0 :(得分:0)

您可以将所需元素明确定位为

//div[@id="references-body"]/ol/li

这将只返回49个主要li元素,不包括嵌套的Other versionsPublished as li元素