如何在R中使用模拟数据扩展数据?

时间:2019-02-25 13:11:02

标签: r simulation

我有2列和1000行的数据集,我想将其模拟为10,000行。我尝试使用mvrnorm,但出现了参数不兼容的错误

我的数据集看起来像这样:

FORMAT                    SUB
GT:AD:DP:GQ:PL          0/1:30,10:40:99:189,0,833
GT:AD:DP:GQ:PL          0/0:2,0:2:6:0,6,38
GT:AD:DP:GQ:PL          0/0:1,0:1:3:0,3,34
GT:AD:DP:GQ:PGT:PID:PL  0/1:2,5:7:28:116,0,28
GT:AD:DP:GQ:PGT:PID:PL  0/1:1,2:3:29:40,0,29
GT:AD:DP:GQ:PL          0/0:1,0:1:3:0,3,36

要获得使用我尝试使用的模拟数据扩展此输出的输出:

data <- read.csv('rsim.csv')
sigma <- matrix(data, ncol=2)
mvrnorm(10000, rep(0, nrow(sigma)), sigma, empirical = FALSE)

我也尝试过:

rnorm(sigma)
1.0284460  0.7136265 -2.8664876

但这不是我的预期输出。我的预期输出只是为了增加正态分布中具有相似外观数据的行数

尝试时也会出现错误:

rnorm(10000, sigma)
Error in rnorm(10000, sigma) : invalid arguments

我想要的输出只是将表中的行扩展(而不是重复)更多,以使其保持正态分布。

0 个答案:

没有答案