使用count()函数在XPath中进行模糊匹配

时间:2013-06-24 18:37:32

标签: xml xpath fuzzy-search

我已经在这几个小时了。我似乎无法做到这一点。

我有这个示例XML文件:

<?xml version="1.0" encoding="ISO-8859-1"?>
<!-- Edited by XMLSpy® -->
<bookstore>

<book category="COOKING">
  <title lang="en">Everyday Italian</title>
  <author>Giada De Laurentiis</author>
  <year>2005</year>
  <price>30.00</price>
</book>

<book category="CHILDREN">
  <title lang="en">Harry Potter</title>
  <author>J K. Rowling</author>
  <year>2005</year>
  <price>29.99</price>
</book>

<book category="WEB">
  <title lang="en">XQuery Kick Start</title>
  <author>James McGovern</author>
  <author>Per Bothner</author>
  <author>Kurt Cagle</author>
  <author>James Linn</author>
  <author>Vaidyanathan Nagarajan</author>
  <year>2003</year>
  <price>49.99</price>
</book>

<book category="WEB">
  <title lang="en">Learning XML</title>
  <author>Erik T. Ray</author>
  <year>2003</year>
  <price>39.95</price>
</book>

</bookstore>

我正在尝试使用XPath的count()函数来返回值在文件中出现的次数(返回包含此值的元素数)。

我目前可以使用:

count(//*[contains(author, 'J K.')])

这回归'1'是正确的。现在,假设我不知道我正在搜索的值所在的元素或属性。如果我尝试使用:

count(//*[contains(/*, 'J K.')])

返回'25',这是文件中所有节点的计数。我认为谓词中contains函数中的第一个参数指定了查找值的位置。但是,在这种情况下,似乎表示要返回的值。我有点困惑。我也试过这个:

query = "count(//*[contains(/*, 'J K.')]/book/..)";

这也会带回正确的值,但同样,您必须知道值所在的级别。如果您有一个更复杂的文件,其中包含不同节点的多个级别,并且您仍想搜索整个文件,那么您如何进行此操作?

1 个答案:

答案 0 :(得分:2)

是你没有在谓词中使用当前上下文,而是再次从root开始。


如果您想查询包含“J K”的书籍数量,请将包含应用于所有书籍的上下文:

count(//book[contains(., 'J K.')])

如果你想计算包含文本节点'J K'的标签的出现次数,那也很容易:

count(//*[contains(text(), 'J K.')])

计算包含针头的文本节点的数量也很容易:

count(//text()[contains(., 'J K.')])

在XPath 1.0中无法计算该针的出现次数。在XPath 2.0中,您将在针的出现时分割并返回出现次数减去1。

count(tokenize(/, 'J K\.'))-1

请记住fn:tokenize()使用正则表达式,因此必须转义点。