我正在尝试制作我的第一个词云,并且被我认为简单的东西所淹没。我有一个文本字符串的向量,并希望从他们做一个词云。我想要两种方法: (1)将所有字符串粘贴在一起(x,collapse =“”) 而且(虽然这是较低的优先级) (2)我不希望一个字符串支配其他字符串所以我希望它的唯一字只有一个权重。例如,如果一个字符串多次使用相同的单词,我仍然希望将其视为一个字符。
我查看了tm
和wordcloud
软件包,但它们似乎都是针对更复杂的任务而设计的。我无法弄清楚如何从我的数据中构造Corpus
对象。
我该如何开始?这是一个示例向量,以防它有用:
example <- c("this is a string of text", "another string of text", "one more string of text. This could be a few sentences long", "it looks like string is occurring a lot of times", "I hope this example is long enough. If not I can write more sentences")
答案 0 :(得分:3)
从向量创建语料库的方法是Corpus(VectorSource(example))
。这解决了我的问题