我需要访问此网站并点击链接。单击该链接后,将自动下载文件。我不确定文件更新的频率,但我需要自动化。我知道我可以启动任务调度程序并每天单击该链接并覆盖当前工作目录中的上一个文件。但是,无论如何我还要在下载开始之前检查文件的大小吗?如果文件大小大于目录上的文件,则下载,否则不要下载?
到目前为止,我有这个:
from selenium import webdriver
import os
chromeOptions = webdriver.ChromeOptions()
prefs = {'download.dafault_directory' : os.getcwd()}
chromeOptions.add_experimental_option('prefs',prefs)
chromedriver = 'H://work/chromedriver.exe'
driver = webdriver.Chrome(chrome driver,chrome_options=chromeOptions)
#website where we download files from
url = 'https://supplier.bge.com/electric/load/profiles.asp'
driver.get(url)
driver.implictly_wait(5)
link = driver.find_element_by_link_text('Historical Hourly Load Data')
link.click()
这很有效。但正如我之前提到的,我不确定下次更新的时间。我只是想知道是否有一种更加pythonic的方法来检查我目前在工作目录中的文件的文件大小,如果文件大小比我的大,那么下载,否则不要下载。< / p>