我收到的错误表明格式不正确,而且与xml本身有关。我怎么告诉python忽略xml文件的一部分?
<?xml version="1.0"?>
<solution version="0.1" run date = "2013-04-01">
<description />
<drillholes total_holes="302" total_drilhole_cost="6190">
这是文件的开头,错误发生在运行日期= blah blah,如何让python忽略该部分而不删除代码,谢谢
答案 0 :(得分:0)
您的代码不是格式良好的XML文件。应该是这样的:
- 首先: 你总是需要一个根对象(在你的情况下,这是<solution>
,第二:你总是必须关闭每个打开的标签,第三:你不能在属性名称中使用空格(在你的情况下:run date
)。
<?xml version="1.0"?>
<solution version="0.1" run_date="2013-04-01">
<description />
<drillholes total_holes="302" total_drilhole_cost="6190" />
</solution>
<强>编辑:强>
您唯一的问题出在属性名称中。你必须解决这个问题,然后一切都会好起来的。
答案 1 :(得分:0)
形成不良仍未形成良好状态。每个XML解析器都会抱怨您的文件。 如果您没有有效的XML,请不要使用XML解析器。案件很清楚。如果你想解析你的垃圾格式,那么使用像BeautifulSoup这样的东西或编写你自己的垃圾数据感知解析器。讨论结束。