from lxml import html
import requests
page = requests.get('http://www.freejobalert.com/upsc-advt-no-17/31908/')
tree = html.fromstring(page.content)
tables = tree.xpath('//table/text()')
print(tables)
在这里,我想从url以上获取所有表格。 但是现在有很多表可用,这是空列表 在网页中。
答案 0 :(得分:0)
这是我创建并测试的示例代码,会将表格打印到可以在浏览器中打开的html文件中。
from lxml import html
from lxml import etree
import requests
page = requests.get('http://www.freejobalert.com/upsc-advt-no-17/31908/')
tree = html.fromstring(page.content)
tables = tree.cssselect('table')
file = open("output.html","wb")
for table in tables:
file.write(etree.tostring(table))