最有效的方法是将字符串分解为R中相等长度的子字符串

时间:2018-01-16 02:47:21

标签: r

我有大约300万个可变长度的序列,我想打破重叠的子串。目前,这就是我这样做的方式:

EmptyBase

最有效的方法是什么?如果它可以并行化会很好。

谢谢!

1 个答案:

答案 0 :(得分:0)

不确定最有效的方法,但我们可以使用mclapply中的parallel来并行化它。

  subsequences <- mclapply(sequences, function(x){
  substring(
    x, seq(from = 1, to = (nchar(x) - n + 1)), seq(from = n, to = nchar(x)))
  })
names(subsequences) <- sequences