使用破碎的xml中存在的xml的有效部分

时间:2012-04-04 09:29:45

标签: c libxml2

如何使用破碎的xml中存在的xml的有效部分

Ex:< nodea>
< nodeb> DATA< / nodeb
< nodec> DATA< / nodec>

在上面因为nodea没有被关闭所以这是一个破碎的xml,但是nodeb& nodec是nodea中存在的有效Xmls。所以我可以使用libxml2来检索它们内部的数据。

1 个答案:

答案 0 :(得分:0)

在解析文件之前,你必须通过启发式黑客修复该文件。

$ cat broken.xml 
<nodea>
<nodeb>DATA</nodeb 
<nodec> DATA </nodec>
$ < broken.xml sed 's%</nodeb[^>]%</nodeb>%'
<nodea>
<nodeb>DATA</nodeb>
<nodec> DATA </nodec>