我试图在SAX解析期间计算行号,以便使用一些规则检测XML文档中的错误。
像<CITY>London</CITY>
这样的标记会回复回调on_start_element_ns
和on_end_element_ns
以及此类标记
<BUYER>
<BUYER_ID>00001</BUYER_ID>
<BUYER_NAME>Buyer_1</BUYER_NAME>
</BUYER>
仅响应on_start_element_ns
回调。我使用SAX解析器,因为我有非常大的文件。有任何想法如何为每个标签找到正确的行号?
更新
我使用了 Ox ,它解决了我的问题。 Ox SAX解析器的行号与libxml和nokogiri相反。