我正在使用以下代码来找到div:
parser = etree.HTMLParser()
tree = etree.parse(StringIO(page), parser)
div = tree.xpath("//div[@class='content']")[0]
我唯一的问题是,在执行此操作后,我不想依赖lxml来提取所述div的内容:我只想获取div包含的原始XML。这是可行的还是我必须完全放弃这种方法?
答案 0 :(得分:11)
我认为你在寻找:
etree.tostring(div)
答案 1 :(得分:2)
你试过tostring
吗?
raw_xml = etree.tostring(div)