例如,我只想找到几个单词和输入之间的关联
{
data("crude")
tdm <- TermDocumentMatrix(crude)
findAssocs(tdm, c("oil", "opec", "xyz"), 0.1)
}
在这里,我只想找到c("oil", "opec", "xyz")
和soln = c("was","are","were","am","is","been","being","be")
之间的相关性,而不是整个TDM。
如何实现?
我可以在计算后提取这些结果,但是我希望它在计算上是有效的,因此,仅如上所述计算soln
向量的关联,而不能计算其他任何词。
答案 0 :(得分:0)
我通过更深入地研究findAssocs()函数的实现来解决了这个问题。它在内部使用cor
来确定关联。因此,上述问题的解决方案类似于:
cd<- cor(termFreq1[j,], termFreq1[i,])