使用R

时间:2019-05-23 04:41:02

标签: r

我有2个文件,分别是s1 = 340行和s2 = 241339行。需要通过线程或任何其他方法快速执行它的帮助。

尝试了下面的代码(也已合并了nthread),但是它花费了很多时间,请帮助我加快过程。

 combos <- expand.grid(s1$Response, s2$Response, stringsAsFactors = F) %>% as_tibble() %>% mutate(distance = stringdist(Var1, Var2, method = "lv", nthread = 3)) / (nchar(Var1) + nchar(Var2) / 2)) %>% filter(distance < 0.4)

0 个答案:

没有答案