我有大约300万个可变长度的序列,我想打破重叠的子串。目前,这就是我这样做的方式:
EmptyBase
最有效的方法是什么?如果它可以并行化会很好。
谢谢!
答案 0 :(得分:0)
不确定最有效的方法,但我们可以使用mclapply
中的parallel
来并行化它。
subsequences <- mclapply(sequences, function(x){
substring(
x, seq(from = 1, to = (nchar(x) - n + 1)), seq(from = n, to = nchar(x)))
})
names(subsequences) <- sequences