如何从lxml获取原始XML?

时间:2010-10-24 00:10:14

标签: python xml html-parsing lxml

我正在使用以下代码来找到div:

parser = etree.HTMLParser()
tree = etree.parse(StringIO(page), parser)

div = tree.xpath("//div[@class='content']")[0]

我唯一的问题是,在执行此操作后,我不想依赖lxml来提取所述div的内容:我只想获取div包含的原始XML。这是可行的还是我必须完全放弃这种方法?

2 个答案:

答案 0 :(得分:11)

我认为你在寻找:

etree.tostring(div)

答案 1 :(得分:2)

你试过tostring吗?

raw_xml = etree.tostring(div)