我使用以下代码读取XML文件并使用SAX Parser将其写入XML输出文件。但是,输出文件缺少CDATA指令。 CDATA部分的内容可以,但输出文件中不存在起始<![CDATA[
和结束]]>
!
from xml.sax import make_parser
from xml.sax.handler import ContentHandler
import sys
class XMLWriter():
def __init__ (self, xWriter):
self.xWriter = xWriter
def startElement(self, name, attrs):
self.xWriter.write('<' + name)
for sAttribute in attrs.getNames():
self.xWriter.write(' %s="%s"' % (sAttribute, attrs.getValue(sAttribute)))
self.xWriter.write('>')
def characters (self, ch):
self.xWriter.write(ch)
def endElement(self, name):
self.xWriter.write('</'+ name + '>')
def processingInstruction(self, target, data):
return
def setDocumentLocator(self, dummy):
return
def startDocument(self):
return
def endDocument(self):
return
parser = make_parser()
curHandler = XMLWriter(open('test.out.xml', 'w'))
parser.setContentHandler(curHandler)
parser.parse(open('test.xml'))
我做错了什么?
答案 0 :(得分:0)
CDATA是一种便利注释,用于包含包含标记的文本。文本节点在特定序列化中包含在CDATA中的事实可以由解析器保留或者可以被丢弃。如果你的SAX解析器有CDATA部分的事件,你必须处理它们,然后在出路时重新包装CDATA中的文本节点。