SAX Parser输出中缺少CDATA指令

时间:2010-12-06 19:19:54

标签: python xml sax

我使用以下代码读取XML文件并使用SAX Parser将其写入XML输出文件。但是,输出文件缺少CDATA指令。 CDATA部分的内容可以,但输出文件中不存在起始<![CDATA[和结束]]>

from xml.sax import make_parser 
from xml.sax.handler import ContentHandler 
import sys

class XMLWriter(): 
    def __init__ (self, xWriter):  
            self.xWriter = xWriter

    def startElement(self, name, attrs): 
        self.xWriter.write('<' + name)
        for sAttribute in attrs.getNames():
            self.xWriter.write(' %s="%s"' % (sAttribute, attrs.getValue(sAttribute)))
        self.xWriter.write('>')

    def characters (self, ch): 
        self.xWriter.write(ch)

    def endElement(self, name): 
        self.xWriter.write('</'+ name + '>')

    def processingInstruction(self, target, data):
        return
    def setDocumentLocator(self, dummy):
        return
    def startDocument(self):
        return
    def endDocument(self):
        return

parser = make_parser()    
curHandler = XMLWriter(open('test.out.xml', 'w')) 
parser.setContentHandler(curHandler) 
parser.parse(open('test.xml')) 

我做错了什么?

1 个答案:

答案 0 :(得分:0)

CDATA是一种便利注释,用于包含包含标记的文本。文本节点在特定序列化中包含在CDATA中的事实可以由解析器保留或者可以被丢弃。如果你的SAX解析器有CDATA部分的事件,你必须处理它们,然后在出路时重新包装CDATA中的文本节点。