我有几个这样的字符串:
“ Gesti \ xc3 \ xb3n Tur \ xc3 \ xadstica纲领”
我应该以这种方式存储在xml文件中
<content><![CDATA[Programa Directrices de Gestión Turística]]></content>
我使用以下代码:
from xml.dom import minidom
data_cdata = doc.createCDATASection(text)
cdv = doc.createElement(tag)
cdv.appendChild(data_cdata)
root.appendChild(cdv)
doc.appendChild(root)
但输出为:
<content><![CDATA["Programa Directrices de Gesti\xc3\xb3n Tur\xc3\xadstica]]></content>
我该怎么做?
(对不起,我的英语)
答案 0 :(得分:0)
Python不会像您所希望的那样表示超出ascii范围的字符。特殊字符\xc3\xb3
和\xc3\xad
与每个字符的十六进制序数有关:ó
和í
。
看来您的代码无法很好地转换特殊字符。它没有发布实际的ó
和í
,而是发布了它们各自的表示形式:\xc3\xb3
和\xc3\xad
。现在,我对您使用的库一无所知,但是我会在appendChild函数中搜索有关翻译的快速修复。如果找不到它,则可以使用循环来遍历text
,以删除特殊字符并将其转换为普通字母
(从“ó”到“ o”)。
我希望我能有所帮助:)。
祝你好运
Jesper