我一直在寻找解决方案的互联网,并认为我发现了一个,但我认为升级到tm包已经将输出更改为findAssoc。
我已经从语料库中构建了术语文档矩阵和文档术语矩阵。当我运行以下内容时,我会得到一个列表或带有相关性的单词。
serviceAssoc <- findAssocs(serviceTDM, "service", 0.10)
输出如下所示:
customer desk ...
0.63 0.25
这给出了一个很好的列表(1个列表)与它们的相关性配对。
有没有办法将单词和相关性分开,将其放在矩阵或数据框中进行绘图?在过去的帖子中,以下代码显示有效,但R现在给出了尺寸误差。
servicedf <- data.frame(
corr = findAssocs(serviceTDM, "service",.10)[,1],
terms = row.names(findAssocs(serviceTDM,"service",.10)))
非常感谢任何帮助。
答案 0 :(得分:0)
这个怎么样:
corr = c(0.63,0.25)
names(corr) = c("customer", "desk")
corr
customer desk
0.63 0.25
servicedf <- data.frame(corr = as.vector(corr), terms = names(corr))
servicedf
输出:
corr terms
1 0.63 customer
2 0.25 desk
然后你可以切割结果数据帧
答案 1 :(得分:0)
我找到了答案。首先执行以下操作:
serviceAssoc <- findAssocs(serviceTDM, "service", 0.10)
取消列出:data <- unlist(serviceAssoc)
要使用as.numeric(data)
获取值,然后使用names(data)
获取单词并将其分配给单独的向量,合并并绘制。