仅使用XPath在VTD-XML中进行动态查找

时间:2017-07-19 13:12:51

标签: xml xpath vtd-xml

我尝试使用XPath表达式来查找引用VTD-XML中当前元素的元素。所以说我的XML包含书籍和评级,如下所示:

<root>
  <book id="1" name="Book1"/>
  <book id="2" name="Book1"/>
  <rating book-id="1" value="5"/>
  <rating book-id="2" value="3"/>
</root>

首先,我迭代所有书籍元素。然后,对于每本书,我想执行一个XPath表达式来获取该书的评级。例如:

/root/rating[@book-id=current()/@id]/@value

这不起作用,因为current()函数是XSLT独有的。所以我尝试声明一个名为&#34; current&#34;的变量表达式。到&#34;。&#34;意思是“#34;当前的书&#34;”,但这并不起作用,因为(顾名思义),变量表达式不存储表达式的结果,而是表达式本身。

有没有办法只使用XPath表达式在VTD-XML中实现这种效果? (我意识到在代码中有各种各样的方式,但我想使用纯XPath,以便用户可以轻松创建描述其数据格式的配置文件)

修改 接受的答案的结果是我想要的东西不能使用单个XPath表达式来完成。我最后添加了一个选项,因此用户可以基本指定如何找到当前书籍的唯一标识符(即&#34; ./@ id&#34;或者可能&#34; ./ isbn&#34;)。然后我的代码执行此表达式并将结果替换为rating-search XPath中的某个占位符(例如&#34; $$&#34;)。

1 个答案:

答案 0 :(得分:2)

//*/rating[./@book-id=//book/@id]/@value这样的XPath表达式只应检索与可用图书ID匹配的评分的评分值。

如果您要将<rating book-id="3" value="4"/>添加到XML文档,则XPath将仅返回第1册和第2册的值53,因为没有ID为3的书籍。

使用VTD的简单测试方法可能如下所示:

@Test
public void xpathReference() throws Exception {
    byte[] bytes = ("<root>\n"
                 + "  <book id=\"1\" name=\"Book1\"/>\n"
                 + "  <book id=\"2\" name=\"Book1\"/>\n"
                 + "  <rating book-id=\"1\" value=\"5\"/>\n"
                 + "  <rating book-id=\"2\" value=\"3\"/>\n"
                 + "  <rating book-id=\"3\" value=\"4\"/>\n"
                 + "</root>").getBytes();

    VTDGen vtdGenerator = new VTDGen();
    vtdGenerator.setDoc(bytes);
    vtdGenerator.parse(true);
    VTDNav vtdNavigator = vtdGenerator.getNav();

    AutoPilot autoPilot = new AutoPilot(vtdNavigator);
    autoPilot.selectXPath("//*/rating[./@book-id=//book/@id]/@value");
    int id;
    int count = 0;
    while ((id = autoPilot.evalXPath()) != -1) {
        String elementName = vtdNavigator.toString(id);
        int text = vtdNavigator.getAttrVal(elementName);
        String txt = text != -1 ? vtdNavigator.toNormalizedString(text) : "";
        System.out.println("Found match at ID " + id + " in field name '" + elementName + "' with value '" + txt + "'");
        count++;
    }
    System.out.println("Total number of matches: " + count);
    assertThat(count, is(equalTo(2)));
}

在执行此测试方法时,您应该看到与此类似的输出:

Found match at ID 15 in field name 'value' with value '5'
Found match at ID 20 in field name 'value' with value '3'
Total number of matches: 2

根据评论,上面的代码没有以类似迭代的方式提取当前处理的书籍的数据。下面的代码现在试图实现这个目标:

@Test
public void xpathReference() throws Exception {
    byte[] bytes = ("<root>\n"
                    + "  <book id=\"1\" name=\"Book1\"/>\n"
                    + "  <book id=\"2\" name=\"Book2\"/>\n"
                    + "  <book id=\"4\" name=\"Book3\"/>\n"
                    + "  <rating book-id=\"1\" value=\"5\"/>\n"
                    + "  <rating book-id=\"2\" value=\"3\"/>\n"
                    + "  <rating book-id=\"3\" value=\"4\"/>\n"
                    + "</root>").getBytes();

    VTDGen vtdGenerator = new VTDGen();
    vtdGenerator.setDoc(bytes);
    vtdGenerator.parse(true);
    VTDNav vtdNavigator = vtdGenerator.getNav();

    AutoPilot autoPilot = new AutoPilot(vtdNavigator);
    autoPilot.selectXPath("//book/@id");
    int id;
    int count = 0;
    while ((id = autoPilot.evalXPath()) != -1) {
        String elementName = vtdNavigator.toString(id);
        int bookId_id = vtdNavigator.getAttrVal(elementName);
        String bookId = bookId_id != -1 ? vtdNavigator.toNormalizedString(bookId_id) : "";

        AutoPilot xpathBookName = new AutoPilot(vtdNavigator);
        xpathBookName.selectXPath("//book[@id=" + bookId + "]/@name");
        String bookName = xpathBookName.evalXPathToString();

        AutoPilot xpathRating = new AutoPilot(vtdNavigator);
        xpathRating.selectXPath("//rating[@book-id=" + bookId + "]/@value");
        String bookRating = xpathRating.evalXPathToString();

        if ("".equals(bookRating)) {
            System.out.println("Book " + bookName + " with id " + bookId + " has no rating yet");
        } else {
            System.out.println("Book " + bookName + " with id " + bookId + " has a rating of " + bookRating);
        }
        count++;
    }
    System.out.println("Total number of matches: " + count);
    assertThat(count, is(equalTo(3)));
}

如果执行后一个代码,您应该看到如下输出:

Book Book1 with id 1 has a rating of 5
Book Book2 with id 2 has a rating of 3
Book Book3 with id 4 has no rating yet
Total number of matches: 2

请注意,我确实稍微更新了您的第二本书的名称,以便您可以更轻松地查看差异。

  

...是的,很容易在Java代码中获取当前书籍的id然后用它构造一个XPath表达式,但正如我所解释的,我希望用户能够使用XPath来定义他们的文档格式,所以我不想要代码中任何特定于格式的东西

VTD仅支持XPath 1.0。如果您(或您的客户)能够提出XPath 1.0查询,您应该能够通过VTD提取相应的值。我想,简单的XPath查询不足以直接提供您需要的内容。

由于示例可能对于您需要的用例而言很简单,因此很难就如何设计应用程序来处理此类场景提供任何建议。也许用更详细的例子更新您的问题。你可以处理这个问题的一个简单方法是引入占位符变量,这些变量必须单独定义,然后在尝试执行这样的XPath表达式时按下这些占位符,只需用以前提取的值的具体值替换这些占位符。