我正在写一个XPath表达式,我修复了一个奇怪的错误,但是下面两个XPath表达式之间的区别是什么?
"//td[starts-with(normalize-space()),'Posted Date:')]"
和
"//td[starts-with(normalize-space(text()),'Posted Date:')]"
主要是,第一个XPath表达式会捕获什么?因为我得到了很多奇怪的结果。那么text()
在匹配中做了什么?另外,如果我说normalize-space()
& normalize-space(.)
?
答案 0 :(得分:39)
嗯,真正的问题是:.
和text()
之间有什么区别?
.
是当前节点。如果你在期望字符串的地方使用它(即作为normalize-space()
的参数),引擎会自动将节点转换为节点的字符串值,对于元素,元素是连接元素中的所有文本节点。 (因为我猜这个问题实际上是关于元素的。)
text()
仅选择作为当前节点的直接子节点的文本节点。
例如,给定XML:
<a>Foo
<b>Bar</b>
lish
</a>
并假设<a>
是您当前的节点,normalize-space(.)
将返回Foo Bar lish
,但normalize-space(text())
将失败,因为text()
会返回两个文本节点的节点集(Foo
和lish
),normalize-space()
不接受。
简而言之,如果要对元素中的所有文本进行规范化,请使用.
。如果要选择特定的文本节点,请使用text()
,但始终记住,尽管名称为text()
,但{{1}}会返回一个节点集,如果它只有一个元素,则只会自动转换为字符串。 / p>