我正在尝试从大型语料库中清除一些文本,并且在删除停用词时遇到问题。当我运行代码myCorpus <- tm_map(myCorpus, removeWords, stopwords("en"))
时,控制台中的小停止标志会继续运行,从不给我一个结果。我试图让它运行很多个小时,但它仍然没有给我任何结果。
我试图重新启动我的R并在较小的语料库上运行代码,但它一直没有给我任何结果。有没有人经历过这个,现在如何让代码工作?
这是我到目前为止所做的:
myCorpus <- Corpus(VectorSource(c(Delta_2,British_2,American_2)))
myCorpus <- tm_map(myCorpus, content_transformer(tolower))
myCorpus <- tm_map(myCorpus, removeWords, stopwords("en"))