R中的向量化余弦相似度计算

时间:2018-11-27 09:56:11

标签: r vectorization cosine

我正在计算两个项目之间的余弦相似度,并编写了以下代码。

library('lsa')

df <-replicate(1, rnorm(500))

rownames(df) <- paste0("item", seq_len(nrow(df)))

colnames(df) <- paste0("value", seq_len(ncol(df)))



td = tempfile()
dir.create(td)


write( df[1], file=paste(td, "D1", sep="/"))
write( df[2], file=paste(td, "D2", sep="/"))


myMatrix = textmatrix(td, minWordLength=1)




res <- lsa::cosine(myMatrix[,1], myMatrix[,2])

如何通过lapply或apply方法而不是在行之间使用for循环来改进代码?

我宁愿写矢量化方式,也不愿写df [1]和df [2]等。我是新来的,请帮助我。

请提出前进的方向。预先感谢。

0 个答案:

没有答案