我有以下要用xml.dom.minidom
模块
<?xml version="1.0" encoding="UTF-8"?>
<RootTag>
<InnerTag>
<MyValue>"< here is special char."</MyValue>
</InnerTag>
</RootTag>
我有以下代码片段用于解析上面的xml
import xml.dom.minidom
xml.dom.minidom.parse('input_xml')
但我得到以下错误:
parser.Parse(buffer, 0)
xml.parsers.expat.ExpatError: not well-formed (invalid token): line 4, column 26
只有当我提供'&amp;'时才会出现上述错误或'&lt;'在MyValue标签中提供
所以,
如何解决此问题?
我不希望通过使用转义序列<
等来更改我的XML。
我想用“”(引号)
答案 0 :(得分:3)
您的示例不是格式良好的XML。除标签之外的其他任何地方都不允许使用<
。您的数据需要包装在CDATA中,或者转发为<
<![CDATA[< here is special char.]]>