模拟R中的样本,存储它们并计算检验统计量

时间:2013-12-04 17:18:16

标签: r montecarlo resampling chi-squared

我使用蒙特卡罗算法使用反演采样生成几何分布大小为100的数据样本:

gi.cdf.geom <- function(p,u){
k <- c()
k <- ceiling(log(1-u)/log(1-p)) - 1
return(k)
}

上述函数是几何分布的CDF的反函数

u1 <- runif(100)
gen.gi.cdf1 <- gi.cdf.geom(50/239,u1)
as.data.frame(table(gen.gi.cdf1))

我不知道该怎么做是随机模拟1000个大小为100的数据样本,并计算每个样本的卡方检验统计量。我创建样本的尝试如下:

for(i in 1:1000){
 n=100
 p=50/239
 {
  u=runif(n)
  values <- gi.cdf.geom(p,u)
 }
 print(values)

}

然而,这给了我控制台的所有样本,以后无法再提及它们。

我真的很感激一些帮助。

谢谢

1 个答案:

答案 0 :(得分:2)

使用replicate。例如:

(x <- replicate(3,rgeom(10,50/239)))
      [,1] [,2] [,3]
 [1,]    5    3   12
 [2,]   15    2    3
 [3,]    5    5    0
 [4,]    4    2    1
 [5,]   13    0    8
 [6,]    0    3    0
 [7,]    3    1    6
 [8,]    0    6    2
 [9,]    0    4    4
[10,]    8    4    1

您可以使用apply

对其进行测试
apply(x,2,chisq.test)
[[1]]

        Chi-squared test for given probabilities

data:  newX[, i] 
X-squared = 47.566, df = 9, p-value = 3.078e-07


[[2]]

        Chi-squared test for given probabilities

data:  newX[, i] 
X-squared = 10, df = 9, p-value = 0.3505


[[3]]

        Chi-squared test for given probabilities

data:  newX[, i] 
X-squared = 37.3243, df = 9, p-value = 2.303e-05


Warning messages:
1: In FUN(newX[, i], ...) : Chi-squared approximation may be incorrect
2: In FUN(newX[, i], ...) : Chi-squared approximation may be incorrect