这是我的第一个问题,请不要吝啬:)。
我正在尝试从here下载所有的SDS(格式为pdf格式)。
起初我尝试过请求和BeautifulSoup,但是从Javascript弹出的pdf,然后使用Selenium,但它没有用。 到目前为止,我的代码是以下内容,我不知道下一步该做什么。
from selenium import webdriver
pdf_url= "http://www.sigmaaldrich.com/MSDS/MSDS/DisplayMSDSPage.do?country=US&language=en&productNumber=474711&brand=ALDRICH&PageToGoToURL=http%3A%2F%2Fwww.sigmaaldrich.com%2Fcatalog%2Fproduct%2Faldrich%2F474711%3Flang%3Den"
driver = webdriver.Firefox()
driver.get(pdf_url)
driver.find_element_by_name("msdsPageFrame").get_attribute("src")