我试图从R中的findAssoc中提取单词和相关性

时间:2015-09-02 18:13:42

标签: r matrix correlation word tm

我一直在寻找解决方案的互联网,并认为我发现了一个,但我认为升级到tm包已经将输出更改为findAssoc。

我已经从语料库中构建了术语文档矩阵和文档术语矩阵。当我运行以下内容时,我会得到一个列表或带有相关性的单词。

serviceAssoc <- findAssocs(serviceTDM, "service", 0.10)

输出如下所示:

customer     desk  ...
    0.63     0.25

这给出了一个很好的列表(1个列表)与它们的相关性配对。

有没有办法将单词和相关性分开,将其放在矩阵或数据框中进行绘图?在过去的帖子中,以下代码显示有效,但R现在给出了尺寸误差。

servicedf <- data.frame(
                    corr = findAssocs(serviceTDM, "service",.10)[,1],
                    terms = row.names(findAssocs(serviceTDM,"service",.10)))

非常感谢任何帮助。

2 个答案:

答案 0 :(得分:0)

这个怎么样:

corr = c(0.63,0.25)
names(corr) = c("customer", "desk")
corr

customer     desk 
    0.63     0.25 

servicedf <- data.frame(corr = as.vector(corr), terms = names(corr))
servicedf

输出:

  corr    terms
1 0.63 customer
2 0.25     desk

然后你可以切割结果数据帧

答案 1 :(得分:0)

我找到了答案。首先执行以下操作:

serviceAssoc <- findAssocs(serviceTDM, "service", 0.10)

取消列出:data <- unlist(serviceAssoc)

要使用as.numeric(data)获取值,然后使用names(data)获取单词并将其分配给单独的向量,合并并绘制。