使用显示空表的请求进行网络抓取?

时间:2018-09-30 14:29:07

标签: python django

from lxml import html
import requests
page = requests.get('http://www.freejobalert.com/upsc-advt-no-17/31908/')
tree = html.fromstring(page.content)
tables = tree.xpath('//table/text()')
print(tables)

在这里,我想从url以上获取所有表格。 但是现在有很多表可用,这是空列表 在网页中。

1 个答案:

答案 0 :(得分:0)

这是我创建并测试的示例代码,会将表格打印到可以在浏览器中打开的html文件中。

from lxml import html
from lxml import etree
import requests

page = requests.get('http://www.freejobalert.com/upsc-advt-no-17/31908/')
tree = html.fromstring(page.content)
tables = tree.cssselect('table')

file = open("output.html","wb") 

for table in tables:
    file.write(etree.tostring(table))