我有1000万篇XML格式的文章。下面给出了一个样本结构 -
<address-book>
<contact type="individual">
<name c="10">Zane Pasolini</name>
<address>999 W. Prince St.</address>
<city>New York</city>
<province>NY</province>
<postalcode>10013</postalcode>
<country>USA</country>
<telephone>1-212-345-6789</telephone>
</contact>
<contact type="business">
<name c="11">SAMOFIX d.o.o.</name>
<address>Ilica 47-2</address>
<city>Zagreb</city>
<province/>
<postalcode>10000</postalcode>
<country>Croatia</country>
<telephone>385-1-123-4567</telephone>
</contact>
</address-book>
我使用Lucene 4.x索引这些XML文件。我也有一个XSLT 转换这些XML文件,以便用户可以用装饰好的格式查看它们。
我想知道在索引之后,XML结构是完整的还是松散的 格式 ?对于Ex-如果用户搜索“个人”联系人类型,那么我可以 检索包含XML节点的所有数据,以便我的XSLT将它们转换为 装修精良的HTML?