我试图从以下页面进入: https://ideas.repec.org/a/aea/aecrev/v92y2002i3p411-433.html 参考文献清单。
为了这样我试着抓住所有的" li" div下的元素" references-body"。
正如您所看到的,在某些情况下,列表中包含旧版本或其他版本的参考。我不想要那些。
我使用以下代码 - 但它似乎无法正常工作 有什么帮助吗?
//div[@id="references-body"]//li[not(ancestor::div[@class="otherversion" or
@class="publishedas"]) and (@class="downfree" or @class="downgate" or
@class="downnone")]
谢谢!
答案 0 :(得分:0)
您可以将所需元素明确定位为
//div[@id="references-body"]/ol/li
这将只返回49个主要li
元素,不包括嵌套的Other versions
和Published as
li
元素