Python pdf下载。下载后无法打开pdf

时间:2019-01-11 08:37:24

标签: python pdf urllib

我下载了一堆pdf文件并将其存档。
大多数文档都能正常工作,但是我有一个问题。
无效的文档链接是:
https://www.ishares.com/de/professionelle-anleger/de/literature/fact-sheet/susm-ishares-msci-em-sri-ucits-etf-fund-fact-sheet-de-de.pdf 当我正常下载它时,它就可以正常工作。
我用python尝试了两种不同的方法来下载它。

response = requests.get('https://www.ishares.com/de/professionelle-anleger/de/literature/fact-sheet/susm-ishares-msci-em-sri-ucits-etf-fund-fact-sheet-de-de.pdf',
    stream=True)

    with open(
           'test.pdf',
            'wb') as r:
        for chunk in response.iter_content(2000):
            r.write(chunk)
        r.close()  

第二种方法:

def pdfDownload(url):
    response = requests.get(url)
    expdf = response.content
    egpdf = open('test.pdf', 'wb')
    egpdf.write(expdf)
    egpdf.close()  

在这两种情况下,当我尝试将其打开后都会收到错误消息。

1 个答案:

答案 0 :(得分:1)

您需要使用此网址替换

https://www.ishares.com/de/professionelle-anleger/de/literature/fact-sheet/susm-ishares-msci-em-sri-ucits-etf-fund-fact-sheet-de-de.pdf?switchLocale=y&siteEntryPassthrough=true