用R进行字符串模拟

时间:2016-02-23 16:41:17

标签: r simulation

我是R.的新人 我想知道如何模拟字符串数据,例如

> ABCDAABCDRFSSAAABE 

> ABCDDEDEEEF

> AABBCCDDDDEABCEDFABD 

> ...

2 个答案:

答案 0 :(得分:3)

我会使用base R函数随机化所选字母和样本数。您可以选择输出的向量数量。向量LETTERS是大写字母字符的内置向量。 :

replicate(3, sample(LETTERS, size=sample(length(LETTERS))))

答案 1 :(得分:1)

我们可以使用stri_rand_strings

中的library(stringi)
library(stringi)
stri_rand_strings(1, 8, '[A-Z]')
#[1] "PZFBVYVJ"

如果我们需要包含不同字母数的多个字符串,只需更改nlength

stri_rand_strings(2, sample(8:16, 2, replace=FALSE),'[A-Z]')
#[1] "XABWTQRDKCPSHKY" "SWPIARRENKCHHO" 

根据文档,用法是

  

stri_rand_strings(n,length,pattern =“[A-Za-z0-9]”)

使用stringi功能的一个优点是速度。它会非常快。关于另一个解决方案的另一个问题是这不是循环。 replicate正在使用sapply这是一个循环。