我正在尝试创建1000个数据集,每个数据集具有4个变量,X1是正常(0,1),X2是正常(0,1),X3是expit(0.5X1 + 0.8X2),A是Bernouli(X3 )。所有变量都有2500个观测值。
我想将1000个数据集中的每一个都放入glm模型,但无济于事。
那是我所做的
sim_list = replicate(n =3,
expr = {data.frame(X1 = X1 <- rnorm(2500, mean = 0, sd = 1), X2 = X2 <- rnorm(2500, mean = 0, sd = 1), X3 = X3 <- rnorm(2500, mean = 0, sd = 1), X4 = X4 <- expit(0.5*X1 + 0.8*X3), A = A <- rbern(2500, X4)},
simplify = F)
for (i in 1:3){
glm1[i] <- glm(A~X1, family = binomial, data = sim_list[[i]])
score[i] <- glm1[i]$fitted.values
}
在此方面,我真的很感谢帮助
答案 0 :(得分:0)
正如@Michael指出的那样,您不能进行双重分配,请同时使用setWifiEnabled
或<-
,而不要同时使用。在复制内部,您尝试在不存在的列上创建条件为=
的数据框列(尚未)。所以这行不通。我们首先使函数起作用:
X4 = expit(0.5*X1 + 0.8*X3)
函数library(simcausal)
library(locfit)
func = function(){
X1 = rnorm(2500, mean = 0, sd = 1)
X2 = rnorm(2500, mean = 0, sd = 1)
X3 = rnorm(2500, mean = 0, sd = 1)
X4 = expit(0.5*X1 + 0.8*X3)
A = rbern(2500, X4)
data.frame(X1,X2,X3,X4,A)
}
现在可以工作:
func()
我们创建sim_list:
head(func())
X1 X2 X3 X4 A
1 -0.316250388 1.7826809 -0.57710388 0.3498251 1
2 -0.140362056 -0.1895857 0.66395833 0.6132480 1
3 -0.008822927 -0.8104381 -0.57667306 0.3856227 0
4 1.053421856 1.5677077 -1.92307184 0.2666382 1
5 -0.142992075 0.3378479 1.13319243 0.6974233 1
6 -1.502032980 -0.3575286 -0.02838796 0.3156735 0
现在是另一个重要的部分,您需要创建一个列表来存储结果,然后使用双方括号sim_list <- replicate(n =3,func(),simplify = F)
分配它们:
[[