令人难以置信的基本lxml问题:获取lxml.etree._Element的HTML /字符串内容?

时间:2011-03-22 18:20:56

标签: python lxml

这是一个基本问题,我实际上在文档中找不到它: - /

以下内容:

img = house_tree.xpath('//img[@id="mainphoto"]')[0]

如何获取<img/>代码的HTML?

我尝试添加html_content(),但获得AttributeError: 'lxml.etree._Element' object has no attribute 'html_content'

此外,它是一个包含一些内容的标记(例如<p>text</p>)我如何获取内容(例如text)?

非常感谢!

1 个答案:

答案 0 :(得分:55)

我想它会如此简单:

from lxml.etree import tostring
inner_html = tostring(img)

至于从<p>内部获取内容,例如,某些选定元素el

content = el.text_content()