我正在尝试模拟一个数据集而且有点卡在下面,因为我对R有点新。这是我到目前为止的代码:
set.seed(10)
n <- 300
x1a <- rnorm(100,1,2)
x1b <- rnorm(100,0,1)
x1c <- rnorm(100,1,0.5)
x1 <- c(x1a,x1b,x1c)
x2a <- rnorm(100,1,2)
x2b <- rnorm(100,1,1)
x2c <- rnorm(100,0,0.5)
x2 <- c(x2a,x2b,x2c)
这就是我想要创造的:
具有300个观测值和三个变量的数据集:x1,x2和g。
g具有3个水平,其中lv11具有观察值1-100,lv12具有obs 101-200,并且lvl3具有obs 201-300。
x1和x2具有以下因素:
前100个障碍物的平均值为1表示x1,平均值表示1表示x2,sd表示2表示两者;
第二个100 obs为x1的平均值为0,x2的平均值为1,两者的sd均为1;
第三个100的平均值为x1的平均值为1,x2的平均值为0,两者的平均值为0.5。
我能够在上面的代码中创建前两个向量x1和x2。但是,在创建g时,我不知道从哪里开始以及如何将其合并到数据集中。我也不确定如何将所有内容组合起来,只生成一个包含所有这些因素的300个观测值的向量。
有什么建议吗?
谢谢!