我能够制作文字云,但我的问题是当我采用字数的频率时,我得到频率为1的字。我想要频率大于2的字。我该怎么做?
tdm只是一个术语矩阵。我试过像rowSums(m>2)
这样的东西,但它不起作用
# define tdm as matrix
m = as.matrix(tdm)
# get word counts in decreasing order
word_freqs = sort(rowSums(m), decreasing=TRUE)
# create a data frame with words and their frequencies
dm = data.frame(word=names(word_freqs), freq=word_freqs)
尝试从https://sites.google.com/site/miningtwitter/questions/talking-about/wordclouds/wordcloud1
制作答案 0 :(得分:2)
您可以在构建data.frame之前简单地过滤word_freqs
:
word_freqs <- word_freqs[word_freqs > 2]