XPATH在提取全文时排除内部标记并恢复原始句子顺序

时间:2016-11-15 08:30:34

标签: xpath

<p>abc</p> 
<p>c<strong>d<\/strong></p>

我尝试使用xpath提取p标记内的全文。我使用表达式//div[@id='artibody']/p//text(),但我无法恢复原始句子顺序。结果是['abc', 'c', 'd']

1 个答案:

答案 0 :(得分:0)

这应该有效:string-join(//div[@id='artibody']/p//text(), "")

返回:abccd

//忽略子标记,string-join连接结果。

如果要添加木工字符串,请使用第二个参数:

string-join(//div[@id='artibody']/p//text(), "-")

返回:abc-c-d

请参阅here以获取解释。