这是我的xml文档的一个片段:
<Title>example<\title>
This article is an example
<section>intro<\section>
<p> bla blablablablablablablablabla.
Here is an image <image>blablablabla<\image> <caption>example image<\image>
</p>
.
.
.
.
标签是嵌套的,所以首先我需要获得doc的结构,然后是内容。如何扫描文档并获得整个结构?
很容易在&lt; \ title&gt;之间获得“exmaple”。如何只获取内容“本文就是一个例子”,它没有被任何标签包围。