Question

我正在制作我的第一个Python项目。我正试图抓一个这样的网页：

page = requests.get('http://www.mypage.com')
tree = html.fromstring(page.content)
table = tree.xpath('//table[@class="list"]')

但是，我不确定返回的表是否正确。

有没有办法检查表中的html内容？

如果我尝试这样做：

print str(table)

我得到了这个输出，这不是很有用：

[<Element table at 0x10b20b6d8>]

Answer 1

您可以使用tostring()打印元素的原始HTML：

from lxml import html

.....

html.tostring(table[0])