生成矩阵时RStudio致命错误

时间:2014-03-21 15:25:14

标签: r matrix levenshtein-distance

我正在使用外部函数处理2个char向量,从而生成矩阵。我正在使用Levensthein函数,它比较2个字符串并输出它们的相似性,对于矢量中的每个项目。

对于1000x1000向量的测试,它运行正常。它以4.95秒的速度运行。

 calc_levensthein_D <- function(vector1,vector2){

   #total matrix
   total <- as.matrix(outer(vector1,vector2,levenshteinSim))

   return(total)
 }

然而,在10000x5000向量的情况下,我在处理结束时收到致命错误消息。

以下是一些测试:

~1000x1000 - &gt; 4~6秒

~1000x5000 - &gt; 40~60秒

~10000x1000 - &gt; 688秒~11分钟

~10000x5000 - &gt;约2小时后发生致命错误

这是一个记忆问题?任何想法?我的目标是处理120000x10000矩阵。

OBS:levenshteinSim来自Record Linkage包。

0 个答案:

没有答案