使用编号项解析“XML”

时间:2012-10-15 16:54:51

标签: xml

我遇到过这样的'XML'片段(缩进和缩写 - ...代表更多标签):

<items>"Std Stability"
  <items[1]>
    <id>-2</id>
    ...
  </items[1]>
  <items[2]>
    <id>-5</id>
  </items[2]>
  ...
</items>

[1]数字阻塞了我正在使用的解析器(lxml)。这些有效的格式是否存在?或者我是否必须编写自定义解析器来处理它?<​​/ p>

我对格式没有任何控制权,文档实际上并没有描述或命名格式。

1 个答案:

答案 0 :(得分:2)

这不是有效的Xml文档,您将无法使用任何符合Xml的解析器来处理它。我之前没有看过这样的格式,所以我不知道你会用什么工具来处理它。我假设他们有一个“自制的”Xml-ish解析器,你可能想用它来读取它。从Xml的角度来看 - 在这种情况下,您始终希望在源处修复输入。想要修复这样的东西以使其成为有效的xml通常会导致问题。