我试图在卡方检验中绘制零分布。在R中,使用代码进行蒙特卡罗模拟以获得经验p值是可行的:
chisq.test(d,simulate.p.value=TRUE,B=10000)
但它不会返回分布图。有没有办法让R返回测试的模拟值?
答案 0 :(得分:3)
如果查看chisq.test
的函数定义(capture.output(chisq.test)
左右第56行),您将进入模拟部分:
if (simulate.p.value && all(sr > 0) && all(sc > 0)) {
setMETH()
tmp <- .Call(C_chisq_sim, sr, sc, B, E)
STATISTIC <- sum(sort((x - E)^2/E, decreasing = TRUE))
PARAMETER <- NA
PVAL <- (1 + sum(tmp >= almost.1 * STATISTIC))/(B +
1)
}
这是调用C函数。首先生成一些虚拟数据
## Some data
x <- as.table(rbind(c(762, 327, 468), c(484, 239, 477)))
dimnames(x) <- list(gender = c("F", "M"),
party = c("Democrat","Independent", "Republican"))
然后抓住你需要的位
sr <- rowSums(x)
sc <- colSums(x)
n <- sum(x)
E <- outer(sr, sc, "*")/n
v <- function(r, c, n) c * r * (n - r) * (n - c)/n^3
V <- outer(sr, sc, v, n)
dimnames(E) <- dimnames(x)
B = 2000
tmp <- .Call(stats:::C_chisq_sim, sr, sc, B, E)
STATISTIC <- sum(sort((x - E)^2/E, decreasing = TRUE))
almost.1 <- 1 - 64 * .Machine$double.eps
PVAL <- (1 + sum(tmp >= almost.1 * STATISTIC))/(B + 1)
变量tmp
包含您想要的输出。变量PVAL
匹配
chisq.test(x, simulate.p.value = T, B=2000)$p.value
注意我已使用:::
,因为函数C_chisq_sim
未从统计信息中导出。