R:Wordcloud:给出部分单词+连词

时间:2015-06-30 14:03:16

标签: r word-cloud

首次使用R wordcloud和tm软件包,请执行以下操作:

rwordcloud

正如你在下面看到的那样,我的输出中出现两个奇怪的错误:它有时会给出部分单词(busi,peopl,everi),并且它将收缩视为自己的单词('ll,'re)。 / p>

有关如何解决此问题的任何建议?

enter image description here

2 个答案:

答案 0 :(得分:0)

可重复的例子确实会有所帮助。不过,我可能会给出一个希望有用的提示。如果您的单词列表存储在my_words中,则可以在添加

时提供帮助
my_words <- tm_map(my_words,content_transformer(removePunctuation))
代码中的

。这至少可以消除&#34;&#39; ll&#34;并且&#34;&#39;&#34;。也许......

答案 1 :(得分:0)

感谢您的协助。

看起来这与词干有关,因为一旦我删除了代码的干扰方面,一切都很顺利。

这让我到了我想去的地方,现在我只需要开始查看,看看我实际上想要阻止哪些词。

Text-mining with the tm-package - word stemming