这是一个基本问题,我实际上在文档中找不到它: - /
以下内容:
img = house_tree.xpath('//img[@id="mainphoto"]')[0]
如何获取<img/>
代码的HTML?
我尝试添加html_content()
,但获得AttributeError: 'lxml.etree._Element' object has no attribute 'html_content'
。
此外,它是一个包含一些内容的标记(例如<p>text</p>
)我如何获取内容(例如text
)?
非常感谢!
答案 0 :(得分:55)
我想它会如此简单:
from lxml.etree import tostring
inner_html = tostring(img)
至于从<p>
内部获取内容,例如,某些选定元素el
:
content = el.text_content()