我有一个巨大的字符串,其中一部分包含如下:
<df>asdffs</df><titletext xml:lang="eng" original="y">Dose intensity <inf>low</inf> in advanced cancer: Have we answered the question?</titletext><sdf>gfdgas</sdf>
我需要查找<inf>
标记中是否存在<titletext>
标记。
我用Java编写它。
提前致谢。
答案 0 :(得分:0)
我强烈建议使用XML解析器(SAX,因为您的文档应该很大 - 它不会立即将所有文档加载到内存中,而是将其流式传输)并以这种方式解析它。您将避免正则表达式处理程序无法处理的所有边缘情况(因为XML不是常规)
在上面的示例中,您应该维护一堆遇到的XML元素,并跟踪<inf>
是否<titletext>