我想通过其主要级别条目的ID来索引XML文件。我计划解析整个文档,从条目中提取ID并将其编入索引(记住开始标记<
的文件位置和结束标记>
+ 1的位置)。稍后这将允许我通过ID快速找到这个地方。
但是可以用SAX跟踪文件位置吗?
如果SAX无法实现,那么还有其他解析器吗?
更新
我发现Location有getCharacterOffset()
方法。它是StAX
吗?
更新2
Location
有效但不知何故意外。第一个标签是mediawiki
,它从零位开始。同时getCharacterOffset()
从处理开始就返回4。
看起来有些预先发生。