XML错误:格式不正确

时间:2013-05-25 17:35:55

标签: python xml-parsing

我收到的错误表明格式不正确,而且与xml本身有关。我怎么告诉python忽略xml文件的一部分?

    <?xml version="1.0"?>
    <solution version="0.1" run date = "2013-04-01">
        <description />
        <drillholes total_holes="302" total_drilhole_cost="6190">

这是文件的开头,错误发生在运行日期= blah blah,如何让python忽略该部分而不删除代码,谢谢

2 个答案:

答案 0 :(得分:0)

您的代码不是格式良好的XML文件。应该是这样的:

- 首先: 你总是需要一个根对象(在你的情况下,这是<solution>第二:你总是必须关闭每个打开的标签,第三:你不能在属性名称中使用空格(在你的情况下:run date)。

<?xml version="1.0"?>
<solution version="0.1" run_date="2013-04-01">
    <description />
    <drillholes total_holes="302" total_drilhole_cost="6190" />
</solution>

<强>编辑:

您唯一的问题出在属性名称中。你必须解决这个问题,然后一切都会好起来的。

答案 1 :(得分:0)

形成不良仍未形成良好状态。每个XML解析器都会抱怨您的文件。 如果您没有有效的XML,请不要使用XML解析器。案件很清楚。如果你想解析你的垃圾格式,那么使用像BeautifulSoup这样的东西或编写你自己的垃圾数据感知解析器。讨论结束。