我正在计算两个项目之间的余弦相似度,并编写了以下代码。
library('lsa')
df <-replicate(1, rnorm(500))
rownames(df) <- paste0("item", seq_len(nrow(df)))
colnames(df) <- paste0("value", seq_len(ncol(df)))
td = tempfile()
dir.create(td)
write( df[1], file=paste(td, "D1", sep="/"))
write( df[2], file=paste(td, "D2", sep="/"))
myMatrix = textmatrix(td, minWordLength=1)
res <- lsa::cosine(myMatrix[,1], myMatrix[,2])
如何通过lapply或apply方法而不是在行之间使用for循环来改进代码?
我宁愿写矢量化方式,也不愿写df [1]和df [2]等。我是新来的,请帮助我。
请提出前进的方向。预先感谢。