在R中搜索文本

时间:2015-03-22 20:11:07

标签: r text mining pubmed

我正在尝试在名为RISmed的R包中进行查询,该包将从pubmed数据库中搜索和下载相关的期刊文章信息。我想一起搜索两个单词,例如:

query= "gene sequencing"
search<-EUtilsSummary(query,type="esearch",db = "pubmed",mindate=2014, maxdate=2014, retmax=20)

如果我使用,上面的命令,它将分别搜索基因和测序,然后基因和测序,这意味着如果在全文基因和测序存在,我的命令捕获它们但我想以这样的方式搜索,它将考虑&#34;基因测序&#34;,两个词总是在一起。我该如何编写该查询?有人可以帮帮我吗?

提前致谢!

1 个答案:

答案 0 :(得分:1)

我会试试这个:

query <- '"gene sequencing"[Title/Abstract]'

发布的搜索引擎确实接受引用的字符串,您只需要知道如何在R中保留它们。使用周围的单引号是一种方法。使用反斜线报价将是另一个。请注意,我对您的代码进行的实验返回的值表明,escape-backslashing是该包的实现者如何做到的:

> str(search)
Formal class 'EUtilsSummary' [package "RISmed"] with 6 slots
  ..@ db              : chr "pubmed"
  ..@ count           : num 542
  ..@ retmax          : num 20
  ..@ retstart        : num 0
  ..@ PMID            : chr [1:20] "25548628" "25543043" "25542841" "25540641" ...
  ..@ querytranslation: chr "\"gene sequencing\"[Title/Abstract] AND 2014[EDAT] : 2014[EDAT]"