R:循环替换语料库中的同义词时出错

时间:2017-06-13 08:50:23

标签: r loops corpus

我是R的新手。使用TM软件包,我试图通过替换同义词来清理一组txt文档。 因为我将处理大量数据,所以我尝试使用excel设置一个表,其中第一列中的单词将替换为第二列中的单词,并执行循环以替换我的语料库中的单词。我的代码如下所示:

library(tm)

docs <- Corpus(DirSource("C:....txt files"))
list <- read.csv("C:\\.....synonyms list.csv", header=F)
for(s in 1:length(docs)){
  for(x in 1:nrow(list)){
    docs[[s]]$content <- gsub(list[x,1],list[x,2], docs[[s]])
  }
}

但是,我收到了错误:Error in [.data.frame(x$dmeta, tag) : undefined columns selected

有谁知道出了什么问题? 谢谢!

1 个答案:

答案 0 :(得分:0)

可能代替docs[[s]]$content <- gsub(list[x,1],list[x,2], docs[[s]])您需要docs[[s]]$content <- gsub(list[x,1],list[x,2], docs[[s]]$content)。我说也许是因为没有任何数据我无法真正测试它