如何使用破碎的xml中存在的xml的有效部分
Ex:< nodea>
< nodeb> DATA< / nodeb
< nodec> DATA< / nodec>
在上面因为nodea没有被关闭所以这是一个破碎的xml,但是nodeb& nodec是nodea中存在的有效Xmls。所以我可以使用libxml2来检索它们内部的数据。
答案 0 :(得分:0)
在解析文件之前,你必须通过启发式黑客修复该文件。
$ cat broken.xml
<nodea>
<nodeb>DATA</nodeb
<nodec> DATA </nodec>
$ < broken.xml sed 's%</nodeb[^>]%</nodeb>%'
<nodea>
<nodeb>DATA</nodeb>
<nodec> DATA </nodec>