在lxml序列化期间恢复CDATA

时间:2016-08-23 14:11:58

标签: python lxml cdata

我知道我可以在XML解析期间使用以下内容保留CDATA部分:

from lxml import etree

parser = etree.XMLParser(strip_cdata=False)
root = etree.XML('<root><![CDATA[test]]></root>', parser)

请参阅APIs specific to lxml.etree

但是,有没有一种简单的方法可以在序列化期间“恢复”CDATA部分? 例如,通过指定标记名称列表...

例如,我想转:

<CONFIG>
    <BODY>This is a &lt;message&gt;.</BODY>
</CONFIG>

为:

<CONFIG>
    <BODY><![CDATA[This is a <message>.]]></BODY>
</CONFIG>

只是告诉我BODY应该包含CDATA ......

1 个答案:

答案 0 :(得分:1)

这样的东西?

from lxml import etree

parser = etree.XMLParser(strip_cdata=True)
root = etree.XML('<root><x><![CDATA[<test>]]></x></root>', parser)
print etree.tostring(root)

for elem in root.findall('x'):
    elem.text = etree.CDATA(elem.text)
print etree.tostring(root)

产地:

<root><x>&lt;test&gt;</x></root>
<root><x><![CDATA[<test>]]></x></root>