我对"tm
"背后的数学很感兴趣。包findAssocs()
功能。
我发现之前有人问过同样的问题,并且里克有一个很好的解释。
http://r.789695.n4.nabble.com/findAssocs-td3845751.html
但我仍然不了解如何计算两个向量之间的相关值。
例如:
# Correlation word2 with word3
cor(c(0,1,1,1,1),c(0,0,1,1,1))
[1] 0.6123724
如何计算cor(c(0,1,1,1,1),c(0,0,1,1,1))
获取0.6123724
?
我尝试使用余弦来计算,但它不正确。所以有人可以指导我理解这些问题吗?