我有2列和1000行的数据集,我想将其模拟为10,000行。我尝试使用mvrnorm,但出现了参数不兼容的错误
我的数据集看起来像这样:
FORMAT SUB
GT:AD:DP:GQ:PL 0/1:30,10:40:99:189,0,833
GT:AD:DP:GQ:PL 0/0:2,0:2:6:0,6,38
GT:AD:DP:GQ:PL 0/0:1,0:1:3:0,3,34
GT:AD:DP:GQ:PGT:PID:PL 0/1:2,5:7:28:116,0,28
GT:AD:DP:GQ:PGT:PID:PL 0/1:1,2:3:29:40,0,29
GT:AD:DP:GQ:PL 0/0:1,0:1:3:0,3,36
要获得使用我尝试使用的模拟数据扩展此输出的输出:
data <- read.csv('rsim.csv')
sigma <- matrix(data, ncol=2)
mvrnorm(10000, rep(0, nrow(sigma)), sigma, empirical = FALSE)
我也尝试过:
rnorm(sigma)
1.0284460 0.7136265 -2.8664876
但这不是我的预期输出。我的预期输出只是为了增加正态分布中具有相似外观数据的行数
尝试时也会出现错误:
rnorm(10000, sigma)
Error in rnorm(10000, sigma) : invalid arguments
我想要的输出只是将表中的行扩展(而不是重复)更多,以使其保持正态分布。