我已经创建了一个term-document
矩阵,并希望使用它来创建一个barplot
。
我认为x轴上会有类别名称,标题为“单词频率”。
y轴上的数字比例应为0-60,但是只有一个比例,没有单位。
我刚刚开始学习R,并且按照http://www.sthda.com/english/wiki/word-cloud-generator-in-r-one-killer-function-to-do-everything-you-need上的说明进行操作 学习创建频率的箱线图。 但是事实却有所不同,因为我使用了不同的数据集。
我对此坚持了很长时间,非常感谢您的帮助!
dtm <- TermDocumentMatrix(docs)
m <- as.matrix(dtm)
v <- sort(rowSums(m),decreasing=TRUE)
d <- data.frame(word = names(v),freq=v)
head(d, 15)
barplot(d[1:13,]$freq, las = 2,
names.arg = d[1:13,]$word,
col ="lightgreen", main ="Most frequent words",
ylab = "Word frequencies")