使用python +硒问题下载pdf文件

时间:2020-06-25 16:32:46

标签: python-3.x selenium-webdriver

我需要您的帮助,我正在尝试使用python中的Selenium Webdriver自动执行PDF文件的下载,该代码在执行时为我带来了下载链接并在控制台中进行打印,但我需要将其下载并保存在本地PC。

我将ubuntu 18.04用作python 3x中的开发环境。 谢谢

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait as W
from selenium.webdriver.support import expected_conditions as E

URL = "https://www.diariooficial.interior.gob.cl/edicionelectronica/marcas_patentes.php?date=19-06-2020&edition=42685"



wait_time_out = 15
driver = webdriver.Chrome('./chromedriver')
driver.get(URL)
wait_variable = W(driver, wait_time_out)
links = wait_variable.until(E.visibility_of_all_elements_located((By.TAG_NAME, "a")))
print("Numero de links", len(links))
for link in links:
    print(link.text)

1 个答案:

答案 0 :(得分:2)

关于同一问题的帖子很多。

在此(Selenium Webdriver in Python - files download directory change in Chrome preferences)中,有一个修复程序,可在其中更改默认的下载位置。

此外,请记住,您可能需要实现例程以等待下载完成(如果要下载大文件)。

希望有帮助。