Question

我下载了一堆pdf文件并将其存档。
大多数文档都能正常工作，但是我有一个问题。
无效的文档链接是：
https://www.ishares.com/de/professionelle-anleger/de/literature/fact-sheet/susm-ishares-msci-em-sri-ucits-etf-fund-fact-sheet-de-de.pdf 当我正常下载它时，它就可以正常工作。
我用python尝试了两种不同的方法来下载它。

response = requests.get('https://www.ishares.com/de/professionelle-anleger/de/literature/fact-sheet/susm-ishares-msci-em-sri-ucits-etf-fund-fact-sheet-de-de.pdf',
    stream=True)

    with open(
           'test.pdf',
            'wb') as r:
        for chunk in response.iter_content(2000):
            r.write(chunk)
        r.close()

第二种方法：

def pdfDownload(url):
    response = requests.get(url)
    expdf = response.content
    egpdf = open('test.pdf', 'wb')
    egpdf.write(expdf)
    egpdf.close()

在这两种情况下，当我尝试将其打开后都会收到错误消息。

Answer 1

您需要使用此网址替换

https://www.ishares.com/de/professionelle-anleger/de/literature/fact-sheet/susm-ishares-msci-em-sri-ucits-etf-fund-fact-sheet-de-de.pdf?switchLocale=y&siteEntryPassthrough=true

Python pdf下载。下载后无法打开pdf

1 个答案: