哪个XML解析器具有最易读的人为错误报告?

时间:2012-09-25 11:56:15

标签: python xml xml-parsing python-2.7 minidom

标准安装提供的python有很多方法可以处理XML,更多的是作为外部包,请参阅http://wiki.python.org/moin/PythonXml

对于我的项目,我使用minidom,它可以满足我的需求,但错误报告相当于电报,例如:

no element found: line 7, column 0

这是正确的,但不是非常人性化的,也没有暗示可能需要哪个元素。由于缺乏信息,我无法向用户报告错误。

这只是一个例子,但有更多情况下minidom可能更详细但不是。所以我需要一些详细的,一个足够详细的错误,我可以将解析错误传递给用户。

哪个标准XML“处理解决方案”具有最详细的错误报告,如果没有哪个外部包支持XML?

用于解析的xml文件在代码中用作config.xml

<?xml version="1.0" encoding="UTF-8"?>
<widget xmlns="http://www.w3.org/ns/widgets">
    <icon src="icon.png"/>
    <content src="index.html"/>
<name>sample</name>

1 个答案:

答案 0 :(得分:6)

我尝试对上面链接中的所有解析器进行调查,看看哪一个有最有用的错误报告,我停在了lxml:

import xml.dom.minidom as  md
md.parse("config.xml")
#xml.parsers.expat.ExpatError: no element found: line 7, column 0


import elementtree.ElementTree as ET
tree = ET.parse("config.xml")
#xml.parsers.expat.ExpatError: no element found: line 7, column 0


from xml import sax
parser = sax.make_parser()
parser.parse("config.xml")
#xml.sax._exceptions.SAXParseException: config.xml:7:0: no element found


import xml.etree.cElementTree as et
et.parse("config.xml")
#cElementTree.ParseError: no element found: line 7, column 0

import xml.dom.pulldom as pd
doc = pd.parse("config.xml")
for event, node in doc:
     print event, node

#xml.sax._exceptions.SAXParseException: <unknown>:7:0: no element found

import lxml.etree
tree = lxml.etree.parse("config.xml")

#lxml.etree.XMLSyntaxError: Premature end of data in tag widget line 2, line 7, column 1

结论是lxml库具有上述列表中最佳的错误报告:

"Premature end of data in tag widget line 2, line 7, column 1"