我下载了一堆pdf文件并将其存档。
大多数文档都能正常工作,但是我有一个问题。
无效的文档链接是:
https://www.ishares.com/de/professionelle-anleger/de/literature/fact-sheet/susm-ishares-msci-em-sri-ucits-etf-fund-fact-sheet-de-de.pdf
当我正常下载它时,它就可以正常工作。
我用python尝试了两种不同的方法来下载它。
response = requests.get('https://www.ishares.com/de/professionelle-anleger/de/literature/fact-sheet/susm-ishares-msci-em-sri-ucits-etf-fund-fact-sheet-de-de.pdf',
stream=True)
with open(
'test.pdf',
'wb') as r:
for chunk in response.iter_content(2000):
r.write(chunk)
r.close()
第二种方法:
def pdfDownload(url):
response = requests.get(url)
expdf = response.content
egpdf = open('test.pdf', 'wb')
egpdf.write(expdf)
egpdf.close()
在这两种情况下,当我尝试将其打开后都会收到错误消息。
答案 0 :(得分:1)
您需要使用此网址替换
https://www.ishares.com/de/professionelle-anleger/de/literature/fact-sheet/susm-ishares-msci-em-sri-ucits-etf-fund-fact-sheet-de-de.pdf?switchLocale=y&siteEntryPassthrough=true