在java中使用正则表达式来提取xml标记的内容

时间:2013-01-11 10:34:17

标签: java regex

我有一个巨大的字符串,其中一部分包含如下:

<df>asdffs</df><titletext xml:lang="eng" original="y">Dose intensity <inf>low</inf> in advanced cancer: Have we answered the question?</titletext><sdf>gfdgas</sdf>

我需要查找<inf>标记中是否存在<titletext>标记。 我用Java编写它。

提前致谢。

1 个答案:

答案 0 :(得分:0)

我强烈建议使用XML解析器(SAX,因为您的文档应该很大 - 它不会立即将所有文档加载到内存中,而是将其流式传输)并以这种方式解析它。您将避免正则表达式处理程序无法处理的所有边缘情况(因为XML不是常规

在上面的示例中,您应该维护一堆遇到的XML元素,并跟踪<inf>是否<titletext>