检索卡方检验的蒙特卡罗模拟值

时间:2016-04-21 07:43:53

标签: r simulation chi-squared

我试图在卡方检验中绘制零分布。在R中,使用代码进行蒙特卡罗模拟以获得经验p值是可行的:

chisq.test(d,simulate.p.value=TRUE,B=10000)

但它不会返回分布图。有没有办法让R返回测试的模拟值?

1 个答案:

答案 0 :(得分:3)

如果查看chisq.test的函数定义(capture.output(chisq.test)左右第56行),您将进入模拟部分:

    if (simulate.p.value && all(sr > 0) && all(sc > 0)) {
        setMETH()
        tmp <- .Call(C_chisq_sim, sr, sc, B, E)
        STATISTIC <- sum(sort((x - E)^2/E, decreasing = TRUE))
        PARAMETER <- NA
        PVAL <- (1 + sum(tmp >= almost.1 * STATISTIC))/(B + 
            1)
    }

这是调用C函数。首先生成一些虚拟数据

## Some data
x <- as.table(rbind(c(762, 327, 468), c(484, 239, 477)))
dimnames(x) <- list(gender = c("F", "M"),
                party = c("Democrat","Independent", "Republican"))

然后抓住你需要的位

sr <- rowSums(x)
sc <- colSums(x)
n <- sum(x)
E <- outer(sr, sc, "*")/n
v <- function(r, c, n) c * r * (n - r) * (n - c)/n^3
V <- outer(sr, sc, v, n)
dimnames(E) <- dimnames(x)
B = 2000
tmp <- .Call(stats:::C_chisq_sim, sr, sc, B, E)
STATISTIC <- sum(sort((x - E)^2/E, decreasing = TRUE))
almost.1 <- 1 - 64 * .Machine$double.eps                                                  
PVAL <- (1 + sum(tmp >= almost.1 * STATISTIC))/(B + 1)

变量tmp包含您想要的输出。变量PVAL匹配

的输出
chisq.test(x, simulate.p.value = T, B=2000)$p.value

注意我已使用:::,因为函数C_chisq_sim未从统计信息中导出。