试图排除xPath的一部分

时间:2017-02-16 03:27:40

标签: xpath

我已经查看了几篇关于此的帖子,但未能应用我想要的结果所用的原则,所以我只是发布我的具体问题。

我正在构建一个Google表格,使用户可以提取圣经经文。 我已经完成了所有工作,但是我遇到了一个隐藏元素被拉入我的文本()的问题。

功能:

=IMPORTXML("http://www.biblestudytools.com/ESV/Numbers/5-3.html", 
           "//*[@class='scripture']//span[2]//text()")

结果:你应该把男性和女性都放在营地外,他们可能不会玷污他们的营地,1在我居住的中间。“

您可以在单词“in”

之前看到“1”

我发现只提取“1”的xPath

//*[@class='scripture']//span[2]//sup//text()

我正试图从文本中删除“1”。

请帮助!!! :)

1 个答案:

答案 0 :(得分:0)

您可以在末尾添加谓词,以排除settings.ClientSideEvents.Click = "OnClick";元素内的文本节点:

sup

这将只检索不在=IMPORTXML("http://www.biblestudytools.com/ESV/Numbers/5-3.html", "//*[@class='scripture']//span[2]//text()[not(ancestor::sup)]") 元素内的文本节点,但它仍然会导致该节经过两个单元格,因为有两个文本节点。您可以通过将此表达式包装在sup

中来纠正此问题
JOIN()