我有以下XML示例:
<Template>
<Text id="1">You don't qualify because</Text>
<PertinentDataInputNodeNameListInline id="2">ApplicableConditions</PertinentDataInputNodeNameListInline>
<Text id="3">.</Text>
</Template>
注意:这只是一个例子,模板可能有3个以上的子节点。我们知道句子的方式是通过id属性进行组合。
我如何将这个(使用正则表达式或最有效的方法)组合起来构建一个句子,或许以下列方式使用它的属性:id1 + id2 + id3 + ... + idn。所以输出应该是:
您不具备“适用条件”的资格。
注意Template节点的每个子节点的属性id。任何帮助或帮助将非常感激。
修改
删除了代码,因为它分散了我实际问题的注意力。
答案 0 :(得分:0)
使用剥离标记功能更好,而不是使用Regex。对于Jsoup,这实际上很简单。
public static String html2text(String html) {
return Jsoup.parse(html).text();
}