我正在使用外部函数处理2个char向量,从而生成矩阵。我正在使用Levensthein函数,它比较2个字符串并输出它们的相似性,对于矢量中的每个项目。
对于1000x1000向量的测试,它运行正常。它以4.95秒的速度运行。
calc_levensthein_D <- function(vector1,vector2){
#total matrix
total <- as.matrix(outer(vector1,vector2,levenshteinSim))
return(total)
}
然而,在10000x5000向量的情况下,我在处理结束时收到致命错误消息。
以下是一些测试:
~1000x1000 - &gt; 4~6秒
~1000x5000 - &gt; 40~60秒
~10000x1000 - &gt; 688秒~11分钟
~10000x5000 - &gt;约2小时后发生致命错误
这是一个记忆问题?任何想法?我的目标是处理120000x10000矩阵。
OBS:levenshteinSim来自Record Linkage包。