如何在wordcloud R包中添加更多单词,可以在输出中排除?

时间:2016-10-07 14:31:45

标签: r word-cloud r-package

我使用的是" wordcloud"描述"词云"来自R Packages存储库。当我从一些随机文本创建wordcloud时,会自动省略一些单词,因为它们不应该是wordcloud的一部分。现在,我想添加更多像"这个"和#34;那"到包装,所以他们也被排除在wordcloud之外。

目前,这些单词被排除在文本之外:"是,to,be,I,not,a,of,out,但是,who,here,how,in,some,so,it,it ,因为,反对,哦,由"

1 个答案:

答案 0 :(得分:2)

如果您不需要删除许多单词,则可以执行

set.seed(1)
library(wordcloud)
stopwords <- c("my", "foo", "buzz")
txt <- "hello world. hello my world again. Foo bar fizz buzz."
clean <- gsub(paste(stopwords, collapse="|"), "", txt, ignore.case = TRUE)
par(mfrow = c(1,2))
wordcloud(txt)
wordcloud(clean)

enter image description here