我想对数据帧执行非参数测试。我有三组A,B,C。我想现在A / B,B / C和A / C组之间的统计意义。 我怎么能非参数化呢? 在应用Kruskal-Wallis-Test时,我得到了组之间的整体推理。这可以作为以下事后测试的保护。但是如何编程非参数事后检验(使用Kruskal-Wallis或Mann-Whitney-U)?
x<-c(1,2,3,4,5,6,7,8,9,NA,9,8)
y<-c(2,3,NA,3,4,NA,2,3,NA,2,3,4)
group<-rep((factor(LETTERS[1:3])),4)
df<-data.frame(x,y,group)
df
答案 0 :(得分:2)
好的,只是为了总结上述评论中的讨论,有几种(不太知名的)可能性与R项目进行多次非参数比较。 我在上面的示例中包含了其中两个:
library(pgrimess)
library(nparcomp)
x<-c(1,2,3,4,5,6,7,8,9,NA,8,9)
y<-c(2,3,NA,3,4,NA,2,3,NA,2,3,4)
group<-rep((factor(LETTERS[1:3])),4)
df<-data.frame(x,y,group)
kruskal.test(df$x~df$group)
kruskalmc(df$x~df$group)
m<-nparcomp(x ~ group, data=df, asy.method = "probit", type = "Dunnett", control = "A", alternative = "two.sided", info = FALSE)
summary(m)
nparcomp显然更灵活,可以进行各种对比。我在这里选择Dunnett为例。
有一个建议的多重测试程序,根据几个帖子,在大型数据集中出现了一些准确性问题。 https://stat.ethz.ch/pipermail/r-help/2012-January/300100.html
NDWD <- oneway_test(price ~ clarity, data = diamonds,
ytrafo = function(data) trafo(data, numeric_trafo = rank),
xtrafo = function(data) trafo(data, factor_trafo = function(x)
model.matrix(~x - 1) %*% t(contrMat(table(x), "Tukey"))),
teststat = "max", distribution = approximate(B=1000))
### global p-value
print(pvalue(NDWD))
### sites (I = II) != (III = IV) at alpha = 0.01 (page 244)
print(pvalue(NDWD, method = "single-step"))
另一种可能性是 rms :: polr后面跟rms ::对比Frank Frank所说的对比 https://stat.ethz.ch/pipermail/r-help/2012-January/300329.html
最后,user1317221_G包含了一些非常有用的链接,包括一个包含了。的框图 测试结果https://stats.stackexchange.com/a/20133以及有关箱形图高级图表的更详细说明,可在http://egret.psychol.cam.ac.uk/statistics/R/graphs2.html
进一步找到一个链接希望能解决该领域的一些问题。