我知道我可以在XML解析期间使用以下内容保留CDATA部分:
from lxml import etree
parser = etree.XMLParser(strip_cdata=False)
root = etree.XML('<root><![CDATA[test]]></root>', parser)
请参阅APIs specific to lxml.etree
但是,有没有一种简单的方法可以在序列化期间“恢复”CDATA部分? 例如,通过指定标记名称列表...
例如,我想转:
<CONFIG>
<BODY>This is a <message>.</BODY>
</CONFIG>
为:
<CONFIG>
<BODY><![CDATA[This is a <message>.]]></BODY>
</CONFIG>
只是告诉我BODY
应该包含CDATA ......
答案 0 :(得分:1)
这样的东西?
from lxml import etree
parser = etree.XMLParser(strip_cdata=True)
root = etree.XML('<root><x><![CDATA[<test>]]></x></root>', parser)
print etree.tostring(root)
for elem in root.findall('x'):
elem.text = etree.CDATA(elem.text)
print etree.tostring(root)
产地:
<root><x><test></x></root>
<root><x><![CDATA[<test>]]></x></root>