我想对1000个数据集使用glm函数

时间:2019-11-21 13:10:11

标签: loops replication simulation boot glm

我正在尝试创建1000个数据集,每个数据集具有4个变量,X1是正常(0,1),X2是正常(0,1),X3是expit(0.5X1 + 0.8X2),A是Bernouli(X3 )。所有变量都有2500个观测值。

我想将1000个数据集中的每一个都放入glm模型,但无济于事。

那是我所做的

 sim_list = replicate(n =3,
                     expr = {data.frame(X1 = X1 <- rnorm(2500, mean = 0, sd = 1), X2 = X2 <- rnorm(2500, mean = 0, sd = 1), X3 = X3 <- rnorm(2500, mean = 0, sd = 1), X4 = X4 <- expit(0.5*X1 + 0.8*X3), A = A <- rbern(2500, X4)},
                     simplify = F)

for (i in 1:3){
glm1[i] <- glm(A~X1, family = binomial, data = sim_list[[i]])
score[i] <- glm1[i]$fitted.values
} 

在此方面,我真的很感谢帮助

1 个答案:

答案 0 :(得分:0)

正如@Michael指出的那样,您不能进行双重分配,请同时使用setWifiEnabled<-,而不要同时使用。在复制内部,您尝试在不存在的列上创建条件为=的数据框列(尚未)。所以这行不通。我们首先使函数起作用:

X4 = expit(0.5*X1 + 0.8*X3)

函数library(simcausal) library(locfit) func = function(){ X1 = rnorm(2500, mean = 0, sd = 1) X2 = rnorm(2500, mean = 0, sd = 1) X3 = rnorm(2500, mean = 0, sd = 1) X4 = expit(0.5*X1 + 0.8*X3) A = rbern(2500, X4) data.frame(X1,X2,X3,X4,A) } 现在可以工作:

func()

我们创建sim_list:

head(func())
            X1         X2          X3        X4 A
1 -0.316250388  1.7826809 -0.57710388 0.3498251 1
2 -0.140362056 -0.1895857  0.66395833 0.6132480 1
3 -0.008822927 -0.8104381 -0.57667306 0.3856227 0
4  1.053421856  1.5677077 -1.92307184 0.2666382 1
5 -0.142992075  0.3378479  1.13319243 0.6974233 1
6 -1.502032980 -0.3575286 -0.02838796 0.3156735 0

现在是另一个重要的部分,您需要创建一个列表来存储结果,然后使用双方括号sim_list <- replicate(n =3,func(),simplify = F) 分配它们:

[[