我是R的新手。使用TM软件包,我试图通过替换同义词来清理一组txt文档。 因为我将处理大量数据,所以我尝试使用excel设置一个表,其中第一列中的单词将替换为第二列中的单词,并执行循环以替换我的语料库中的单词。我的代码如下所示:
library(tm)
docs <- Corpus(DirSource("C:....txt files"))
list <- read.csv("C:\\.....synonyms list.csv", header=F)
for(s in 1:length(docs)){
for(x in 1:nrow(list)){
docs[[s]]$content <- gsub(list[x,1],list[x,2], docs[[s]])
}
}
但是,我收到了错误:Error in [.data.frame(x$dmeta, tag) : undefined columns selected
有谁知道出了什么问题? 谢谢!
答案 0 :(得分:0)
可能代替docs[[s]]$content <- gsub(list[x,1],list[x,2], docs[[s]])
您需要docs[[s]]$content <- gsub(list[x,1],list[x,2], docs[[s]]$content)
。我说也许是因为没有任何数据我无法真正测试它