将蒙特卡罗p值排列成矩阵,用于不同的样本大小和方差估计量

时间:2016-11-20 13:54:37

标签: r loops regression linear-regression p-value

以下代码运行良好(基于my previous question)。但是每次运行代码之前,我都必须更改方差估算器(olshc0hc1hc2hc3)。我想用循环来解决这个问题。

此后,我简要介绍一下代码。在代码中,创建了每个样本大小(n = 25, 50, 100, 250, 500, 1000)的1000个回归模型。然后,OLS估计1000中的每个回归模型。之后,我根据1000个样本中x3的不同β值计算t统计量。原假设为:H0: beta03 = beta3,即x3的计算β值等于我定义为1的“实数”值。在最后一步中,我检查零假设被拒绝的频率(显着性水平= 0.05)。我的最终目标是创建一个代码,该代码针对每个样本大小和方差估计器吐出零假设的过程拒绝率。因此,结果应该是一个矩阵,而现在我得到一个矢量作为结果。如果你们中的任何人能够帮助我,我会很高兴的。在这里你可以看到我的代码:

library(car)
sample_size = c("n=25"=25, "n=50"=50, "n=100"=100, "n=250"=250, "n=500"=500, "n=1000"=1000)

B <- 1000
beta0 <- 1
beta1 <- 1
beta2 <- 1
beta3 <- 1
alpha <- 0.05

simulation <- function(n, beta3h0){
t.test.values <- rep(NA, B)
#simulation of size
for(rep in 1:B){
#data generation 
d1 <- runif(n, 0, 1)
d2 <- rnorm(n, 0, 1)
d3 <- rchisq(n, 1, ncp=0)
x1 <- (1 + d1)
x2 <- (3*d1 + 0.6*d2)
x3 <- (2*d1 + 0.6*d3)
# homoskedastic error term: exi <- rchisq(n, 4, ncp = 0)
exi <- sqrt(x3 + 1.6)*rchisq(n, 4, ncp = 0)
y <- beta0 + beta1*x1 + beta2*x2 + beta3*x3 + exi
mydata <- data.frame(y, x1, x2, x3)
#ols estimation
lmobj <- lm(y ~ x1 + x2 + x3, mydata)
#extraction
betaestim <- coef(lmobj)[4]
betavar   <- vcov(lmobj)[4,4]
#robust variance estimators: hc0, hc1, hc2, hc3
betavar0 <- hccm(lmobj, type="hc0")[4,4]
betavar1 <- hccm(lmobj, type="hc1")[4,4]
betavar2 <- hccm(lmobj, type="hc2")[4,4]
betavar3 <- hccm(lmobj, type="hc3")[4,4]
#t statistic
t.test.values[rep] <- (betaestim - beta3h0)/sqrt(betavar)
}
mean(abs(t.test.values) > qt(p=c(1-alpha/2), df=n-4))
}

sapply(sample_size, simulation, beta3h0 = 1)

1 个答案:

答案 0 :(得分:2)

您不需要双嵌套循环。只要确保你的循环中有一个矩阵。使用以下内容更新您当前的simulation

## set up a matrix
## replacing `t.test.values <- rep(NA, B)`
t.test.values <- matrix(nrow = 5, ncol = B)  ## 5 estimators

## update / fill a column
## replacing `t.test.values[rep] <- (betaestim - beta3h0)/sqrt(betavar)`
t.test.values[, rep] <- abs(betaestim - beta3h0) / sqrt(c(betavar, betavar0, betavar1, betavar2, betavar3))

## row means
## replacing `mean(abs(t.test.values) > qt(p=c(1-alpha/2), df=n-4))`
rowMeans(t.test.values > qt(1-alpha/2, n-4))

现在,simulation将返回长度为5的向量。对于每个样本大小,返回所有5个方差估计量的t统计p值的蒙特卡洛估计值。然后,当您致电sapply时,您会得到矩阵结果:

sapply(sample_size, simulation, beta3h0 = 1)
#      n=25  n=50 n=100 n=250 n=500 n=1000
#[1,] 0.132 0.237 0.382 0.696 0.917  0.996
#[2,] 0.198 0.241 0.315 0.574 0.873  0.994
#[3,] 0.157 0.220 0.299 0.569 0.871  0.994
#[4,] 0.119 0.173 0.248 0.545 0.859  0.994
#[5,] 0.065 0.122 0.197 0.510 0.848  0.993