使用R

时间:2019-03-08 13:27:09

标签: r web-scraping citations google-scholar scopus

我想使用R获取引用科学期刊论文的文章列表。

我仅有的信息是文章标题,例如“用叶酚试剂测定蛋白质”。

有人能提供我可以使用的可复制示例来帮助我吗?

这是我到目前为止尝试过的。

R包fulltext似乎很有用,因为它允许检索链接到文章的ID列表。例如,我可以获取文章的DOI:

library(fulltext)
res1 <- ft_search(query = "Protein measurement with the folin phenol reagent", from = "crossref")
res1 <- ft_links(res1)
res1$crossref$ids

通过相同的方式,我可以通过在函数from = "scopus"中设置fulltext::ft_search(并包括一个scopus API密钥)来获得scopus id。

如果使用DOI,我可以使用R库rcrossref获取文章的引用次数:

rcrossref::cr_citation_count(res1$crossref$ids[1])

类似地,如果我要使用Scopus ID而不是DOI,则可以使用R软件包rscopus

不幸的是,此信息对我来说还不够,因为我需要引用该论文的文章列表,而不是编号。

我在互联网上看到很多人使用软件包scholar。但是,如果我理解正确,那么要使其正常工作,我需要文章的作者拥有一个Google Scholar ID,而且我必须找到一种方法来检索此ID。因此,这似乎不是可行的解决方案。

有人知道如何解决此问题吗?

1 个答案:

答案 0 :(得分:0)

获得 DOI 后,您可以使用 OpenCitations API 获取有关引用该文章的出版物的数据。通过 rjson 使用 https://opencitations.net/index/coci/api/v1/citations/{DOI} 包访问 API。字段名称 citing 包含引用该出版物的所有出版物的 DOI 作为值。然后,您可以使用 CrossRef's API 获取有关施引论文的更多元数据,例如标题、期刊、出版日期和作者(通过 https://api.crossref.org/works/{DOI})。

Here is an exampleOpenCitations 的 API,有 3 个引用(截至 2021 年 1 月)。


这是一个可能的代码(与上面的示例相同):

opcit <- "https://opencitations.net/index/coci/api/v1/citations/10.1177/1369148118786043"

result <- rjson::fromJSON(file = opcit)

citing <- lapply(result, function(x){
  x[['citing']]
})
# a vector with three DOIs, each of which cite the paper
citing <- unlist(citing) 

现在我们有了带有三个 DOI 的向量 citing。然后您可以使用 rcrossref 查找有关施引论文的基本信息,例如:

paper <- rcrossref::cr_works(citing[1])

# find out the title of that paper
paper[["data"]][["title"]]

# output: "Exchange diplomacy: theory, policy and practice in the Fulbright program"

由于您在 citing 中有一个 DOI 向量,您也可以使用这种方法:

citingdata <- rcrossref::cr_cn(citing)

citingdata 的输出应指向三篇施引论文的元数据,结构类似于以下两个示例:

[[1]]
[1] "@article{Wong_2020,\n\tdoi = {10.1017/s1752971920000196},\n\turl = {https://doi.org/10.1017%2Fs1752971920000196},\n\tyear = 2020,\n\tmonth = {jun},\n\tpublisher = {Cambridge University Press ({CUP})},\n\tpages = {1--31},\n\tauthor = {Seanon S. Wong},\n\ttitle = {One-upmanship and putdowns: the aggressive use of interaction rituals in face-to-face diplomacy},\n\tjournal = {International Theory}\n}"

[[2]]
[1] "@article{Aalberts_2020,\n\tdoi = {10.1080/21624887.2020.1792734},\n\turl = {https://doi.org/10.1080%2F21624887.2020.1792734},\n\tyear = 2020,\n\tmonth = {aug},\n\tpublisher = {Informa {UK} Limited},\n\tvolume = {8},\n\tnumber = {3},\n\tpages = {240--264},\n\tauthor = {Tanja Aalberts and Xymena Kurowska and Anna Leander and Maria Mälksoo and Charlotte Heath-Kelly and Luisa Lobato and Ted Svensson},\n\ttitle = {Rituals of world politics: on (visual) practices disordering things},\n\tjournal = {Critical Studies on Security}\n}"