Question

from lxml import html
import requests
page = requests.get('http://www.freejobalert.com/upsc-advt-no-17/31908/')
tree = html.fromstring(page.content)
tables = tree.xpath('//table/text()')
print(tables)

在这里，我想从url以上获取所有表格。但是现在有很多表可用，这是空列表在网页中。

Answer 1

这是我创建并测试的示例代码，会将表格打印到可以在浏览器中打开的html文件中。

from lxml import html
from lxml import etree
import requests

page = requests.get('http://www.freejobalert.com/upsc-advt-no-17/31908/')
tree = html.fromstring(page.content)
tables = tree.cssselect('table')

file = open("output.html","wb") 

for table in tables:
    file.write(etree.tostring(table))

使用显示空表的请求进行网络抓取？

1 个答案: