Question

这是一个基本问题，我实际上在文档中找不到它： - /

以下内容：

img = house_tree.xpath('//img[@id="mainphoto"]')[0]

如何获取<img/>代码的HTML？

我尝试添加html_content()，但获得AttributeError: 'lxml.etree._Element' object has no attribute 'html_content'。

此外，它是一个包含一些内容的标记（例如<p>text</p>）我如何获取内容（例如text）？

非常感谢！

Answer 1

我想它会如此简单：

from lxml.etree import tostring
inner_html = tostring(img)

至于从<p>内部获取内容，例如，某些选定元素el：

content = el.text_content()