从RStudio中的大型语料库中删除停用词

时间:2018-05-12 10:57:51

标签: r stop-words

我正在尝试从大型语料库中清除一些文本,并且在删除停用词时遇到问题。当我运行代码myCorpus <- tm_map(myCorpus, removeWords, stopwords("en"))时,控制台中的小停止标志会继续运行,从不给我一个结果。我试图让它运行很多个小时,但它仍然没有给我任何结果。

我试图重新启动我的R并在较小的语料库上运行代码,但它一直没有给我任何结果。有没有人经历过这个,现在如何让代码工作?

这是我到目前为止所做的:

myCorpus <- Corpus(VectorSource(c(Delta_2,British_2,American_2)))

myCorpus <- tm_map(myCorpus, content_transformer(tolower))

myCorpus <- tm_map(myCorpus, removeWords, stopwords("en")) 

0 个答案:

没有答案