如何通过节点属性Java

时间:2016-04-25 04:37:22

标签: java regex xml xml-parsing

我有以下XML示例:

<Template>
   <Text id="1">You don't qualify because</Text>
   <PertinentDataInputNodeNameListInline id="2">ApplicableConditions</PertinentDataInputNodeNameListInline>
   <Text id="3">.</Text>
</Template>

注意:这只是一个例子,模板可能有3个以上的子节点。我们知道句子的方式是通过id属性进行组合。

我如何将这个(使用正则表达式或最有效的方法)组合起来构建一个句子,或许以下列方式使用它的属性:id1 + id2 + id3 + ... + idn。所以输出应该是:

  

您不具备“适用条件”的资格。

注意Template节点的每个子节点的属性id。任何帮助或帮助将非常感激。

修改

删除了代码,因为它分散了我实际问题的注意力。

1 个答案:

答案 0 :(得分:0)

使用剥离标记功能更好,而不是使用Regex。对于Jsoup,这实际上很简单。

public static String html2text(String html) {
    return Jsoup.parse(html).text();
}