来自Scopus API的请求仅写入PDF的第一页

时间:2019-10-23 01:00:22

标签: python python-requests text-mining scopus

我正在尝试从Elsevier API下载全文PDF版本。我可以下载XML,JSON和纯文本格式的全文。因此,API密钥工作正常。但是,我无法下载PDF格式的全文。当我尝试更改标题以接受PDF文件时,它只会写文章的第一页

我尝试了许多不同的DOI,但所有这些都返回了文章的首页。

这是我用来访问论文的请求命令

import requests
r = requests.get('http://api.elsevier.com/content/article/doi/10.1016/0038-1098(87)90044-5?httpAccept=application/pdf', headers=headers)

我正在使用以下代码编写

with open('test.pdf','wb') as f:
    f.write(r.content)

没有错误,但test.pdf只是本文的第一页。

1 个答案:

答案 0 :(得分:2)

默认情况下,文章检索API(https://dev.elsevier.com/documentation/ArticleRetrievalAPI.wadl)允许全文检索XML或JSON格式的文章,而不是PDF格式的文章(开放存取内容除外,其中所有格式的全文均可用) 。对于非OA内容,默认情况下仅PDF的首页可用。