R - 如何以编程方式获取研究文章的引用次数?

时间:2014-12-02 22:13:45

标签: r data-mining

对于R中的数据挖掘研究文献,有没有办法检索文章的引用次数(假设我有pmid,doi或其他一些文章标识符)?

1 个答案:

答案 0 :(得分:1)

嗯......我想出了这个:

#imagine the DOI is : 10.1097/PAI.0b013e3181ecaf1c
#so for google you need to substitute '/' for %2F

doi <- "10.1097/PAI.0b013e3181ecaf1c"
doi2 <- gsub("/", "%2F", doi)
thepage = readLines(paste('http://scholar.google.com.br/scholar?q=', doi2, sep=""))

theDOI <- thepage[grep(paste('doi:', doi, "|Cited by", thepage)]
citedBy <- gregexpr("Cited by", theDOI)

n_of_citations <- lapply(1:length(theDOI), function(x){
    substr(x=theDOI[[x]], start=citedBy[[x]], stop=citedBy[[x]]+10)
})


#usualy on google the first match is the correct result search... so..
n_of_citations[[1]]

[1] "Cited by 23"

基于谷歌搜索结果。但是,并非所有结果都有引用数字,并且谷歌的第一个结果并不总是正确的结果......