我遇到过这样的'XML'片段(缩进和缩写 - ...
代表更多标签):
<items>"Std Stability"
<items[1]>
<id>-2</id>
...
</items[1]>
<items[2]>
<id>-5</id>
</items[2]>
...
</items>
[1]
数字阻塞了我正在使用的解析器(lxml)。这些有效的格式是否存在?或者我是否必须编写自定义解析器来处理它?</ p>
我对格式没有任何控制权,文档实际上并没有描述或命名格式。
答案 0 :(得分:2)
这不是有效的Xml文档,您将无法使用任何符合Xml的解析器来处理它。我之前没有看过这样的格式,所以我不知道你会用什么工具来处理它。我假设他们有一个“自制的”Xml-ish解析器,你可能想用它来读取它。从Xml的角度来看 - 在这种情况下,您始终希望在源处修复输入。想要修复这样的东西以使其成为有效的xml通常会导致问题。