我正在尝试抓取此网页的扩展图部分:https://bigbangtheory.fandom.com/wiki/The_White_Asparagus_Triangulation
我尝试了这个Xpath:
//span[contains(@id,'Extended')]/..//following-sibling::P
但是我错过了这一段:
那天谢尔顿醒来了……
答案 0 :(得分:0)
您必须包括所有p
标签以及表达式匹配的text
之后的H2
个节点。像这样:
<xsl:apply-templates select="//span[contains(@id,'Extended')]/../following-sibling::p|//span[contains(@id,'Extended')]/../following-sibling::text()"/>