Question

我正在使用以下代码来找到div：

parser = etree.HTMLParser()
tree = etree.parse(StringIO(page), parser)

div = tree.xpath("//div[@class='content']")[0]

我唯一的问题是，在执行此操作后，我不想依赖lxml来提取所述div的内容：我只想获取div包含的原始XML。这是可行的还是我必须完全放弃这种方法？

Answer 1

我认为你在寻找：

etree.tostring(div)

Answer 2

你试过tostring吗？

raw_xml = etree.tostring(div)