Question

我正在尝试抓取此网页的扩展图部分：https://bigbangtheory.fandom.com/wiki/The_White_Asparagus_Triangulation

我尝试了这个Xpath：

//span[contains(@id,'Extended')]/..//following-sibling::P

但是我错过了这一段：

那天谢尔顿醒来了……

Answer 1

您必须包括所有p标签以及表达式匹配的text之后的H2个节点。像这样：

<xsl:apply-templates select="//span[contains(@id,'Extended')]/../following-sibling::p|//span[contains(@id,'Extended')]/../following-sibling::text()"/>

文本不整洁时如何使用Xpath获取文本

1 个答案: