从网页python自动下载

时间:2018-03-08 12:13:12

标签: python web-scraping

我正在尝试从此页面下载数据https://www.nordpoolgroup.com/Market-data1/Power-system-data/Production1/Wind-Power-Prognosis/DK/Hourly/?view=table

正如您所看到的,有一个按钮可以自动将数据导出到右侧的Excel。我想创建能够每天自动将此处存在的数据导出到Excel的东西 - 有点像刮刀,但我无法弄明白。

到目前为止,这是我的代码

import urllib2  
nord='https://www.nordpoolgroup.com/Market-data1/Power-system- 
data/Production1/Wind-Power-Prognosis/DK/Hourly/?view=table'  
page=urllib2.urlopen(nord)  
from bs4 import BeautifulSoup as bs
soup=bs(page)
pretty=soup.prettify()
all_links=soup.find_all("a")
for link in all_links:
    print link.get("href")
all_tables=soup.find_all('tables')
right_table=soup.find('table', class_='ng-scope')

这就是我被困的地方,因为似乎没有定义表类。

1 个答案:

答案 0 :(得分:2)

您可以使用 requests 模块。

<强>实施例

import requests
url = "https://www.nordpoolgroup.com/api/marketdata/exportxls"

r = requests.post(url)   #POST Request
with open('data_123.xls', 'wb') as f:
    f.write(r.content)