Question

我知道我可以在XML解析期间使用以下内容保留CDATA部分：

from lxml import etree

parser = etree.XMLParser(strip_cdata=False)
root = etree.XML('<root><![CDATA[test]]></root>', parser)

请参阅APIs specific to lxml.etree

但是，有没有一种简单的方法可以在序列化期间“恢复”CDATA部分？例如，通过指定标记名称列表...

例如，我想转：

<CONFIG>
    <BODY>This is a &lt;message&gt;.</BODY>
</CONFIG>

为：

<CONFIG>
    <BODY><![CDATA[This is a <message>.]]></BODY>
</CONFIG>

只是告诉我BODY应该包含CDATA ......

Answer 1

这样的东西？

from lxml import etree

parser = etree.XMLParser(strip_cdata=True)
root = etree.XML('<root><x><![CDATA[<test>]]></x></root>', parser)
print etree.tostring(root)

for elem in root.findall('x'):
    elem.text = etree.CDATA(elem.text)
print etree.tostring(root)

产地：

<root><x>&lt;test&gt;</x></root>
<root><x><![CDATA[<test>]]></x></root>

在lxml序列化期间恢复CDATA

1 个答案: