更改xml文件中的非法字符

时间:2018-05-07 11:03:16

标签: html xml illegal-characters

我有一个XML文件,其结构如下:

<tag1>
<tag2>This is<>a<AA>text</tag2>
<ABC>0123-</xyz>-89</ABC>
</tag1>

如何更改所有非法&lt;&gt;到&lt;和&gt; 结果如下:

<tag1>
    <tag2>This is&lt;&gt;a&lt;AA&gt;text</tag2>
    <ABC>0123-&lt;/xyz&gt;-89</ABC>
</tag1>

1 个答案:

答案 0 :(得分:1)

生成XML后不应修复此问题,这是首先生成xml的代码中的错误。修复生成无效XML的生成器,之后不要修复无效的xml。

对于编码规范,检查https://www.w3.org/TR/xml/#intern-replacement处的XML规范,但请注意,许多编程语言已经有了这些东西的函数或库,例如,用PHP对字符串进行XML编码,执行{{1 }}

对于许多其他语言,有libxml2,检查http://xmlsoft.org/(它有绑定,其中包括C,C ++,C#,Python,Delphi / Pascal,Ruby,Perl,PHP)