按日期下载所有发布的ID列表(从 - 到)

时间:2016-05-31 07:23:09

标签: download automation pubmed oai

我需要自动化PubMed文章收获。 我发现只有通过术语查询下载PubMed文章并通过pmid下载PubMed文章的示例。 (一篇文章) 但我正在考虑的是按日期(从 - 到)或所有这些列出PubMed ID列表,就像在OAI中一样。

1 个答案:

答案 0 :(得分:2)

您可以将BioPython用于此类目的。以下代码段将为您提供特定日期范围内所有PubMed文章的链接。 PMC文章可以直接下载,其他文章可以提供DOI,但PDF的位置是发布者特定的,不能预测所有文章。

DECLARE @val INT = 3

CREATE TABLE #Test (ID int, Value int)

INSERT INTO #Test VALUES (1,1)
INSERT INTO #Test VALUES (1,2)
INSERT INTO #Test VALUES (1,3)
INSERT INTO #Test VALUES (2,1)
INSERT INTO #Test VALUES (2,2)
INSERT INTO #Test VALUES (3,1) 

SELECT  ID ,
        MAX(Value)
FROM    #Test
WHERE   Value <= @val
GROUP BY ID

DROP TABLE #Test