我正在制作我的第一个Python项目。 我正试图抓一个这样的网页:
page = requests.get('http://www.mypage.com')
tree = html.fromstring(page.content)
table = tree.xpath('//table[@class="list"]')
但是,我不确定返回的表是否正确。
有没有办法检查表中的html
内容?
如果我尝试这样做:
print str(table)
我得到了这个输出,这不是很有用:
[<Element table at 0x10b20b6d8>]
答案 0 :(得分:2)
您可以使用tostring()
打印元素的原始HTML:
from lxml import html
.....
html.tostring(table[0])