在工作中,我被要求计算Wald检验统计量的统计功效。我们正在测试1.54%解释方差的零假设,这就是为什么我们所比较的F分布是非中心的。
现在我被告知首先在零假设下计算显着性水平的临界F值(我们使用.05)。我在R中这样做了:
`groups <- 2
N <- 4440
PV <- 0.0154
min.eff.hyp <- function(N, groups=2, PV=.01, alpha=.05){
df1 <- groups - 1 # numerator degrees of freedom
df2 <- N-groups # denominator degrees of freedom
ncp <- ((N-1)*PV)/(1-PV) # non-centrality parameter
g <- (df1+ncp)^2/(df1+2*ncp) # adjusted df1
k <- (df1+ncp)/df1 # to adjust for non-centrality
crit.central <- qf(1-alpha,g,df2)
crit.val <- crit.central * k
return(paste('Kritischer F-Wert (PV=',PV,'): ',round(crit.val,3), sep = ''))
}
min.eff.hyp(N,groups,PV)`
然后我应该使用这个关键的F值来确定备选假设下的α'。 然后可以使用此α'来计算统计功效。
不幸的是,我不知道如何获得alpha'。我再次尝试使用R:
pf(crit.val,g,df2,ncp)
我认为,考虑到替代假设是正确的,这应该计算我的数据的概率。但事实上,我不知所措。我不知道如何在功率计算中实现非中心性,不知何故我找不到之前遇到过同样问题并且实际找到解决方案的人。
当我针对最小效应假设进行测试并因此与非中心分布进行比较时,如何计算测试的统计功效?
非常感谢你花时间帮助我!
问候, 玛利亚
答案 0 :(得分:1)
我们可以使用以下各项来计算F检验统计量的统计功效:groups
,个人N
,显着性水平alpha
和解释方差百分比{{ 1}}。
一种方法是将非中心F分布与估计的非中心性参数PV
一起使用。如您的示例所示,另一种方法是使用调整后的中央F分布(Murphy et al. 2009)。
仿真结果表明,第一种方法对NCP
的估计更为准确。
power
非中心F分布的模拟:
> theoretical simulation method_1 method_2
> Power 0.4631185 0.4647 0.460971 0.5521764
> F mean 4.518145 4.529506 4.497807 -
> PV 0.0089153 0.0089509 - -
> NCP 3.5 - 3.479744 -
方法1(非中央F分布):
## Simulation to get PV and power
groups <- 2
N <- 500
alpha <- 0.05
ncp <- 3.5 #Non-Centrality Parameter
#simulated Sum of Squares for Model and Error
set.seed(1)
df1 <- groups - 1 #main effect degrees of freedom
df2 <- N - groups #error degrees of freedom
SSM = SSE = rep(NA,10000)
for (i in 1:10000)
{
SSM[i] <- sum(rnorm(df1, mean=sqrt(ncp/df1))^2)
SSE[i] <- sum(rnorm(df2)^2)
}
#mean F
F <- SSM/df1 / (SSE/df2)
mean(F) #estimated
> 4.529506
(df1+ncp) / df1 / ((df2-2)/df2) #theoretical
> 4.518145
#PV: Percentage of explained Variance
PV <- SSM / (SSM + SSE)
mean(PV)
> 0.008950899
(ncp + df1) / (ncp + df1 + df2) #theoretical
> 0.008915272
#statistical Power
F_crit <- qf(1-alpha, df1, df2) #critical F value
sum(F > F_crit) / length(F) #estimated
> 0.4647
1 - pf(F_crit, df1, df2, ncp) #theoretical
> 0.4631185
方法2(调整后的中央F分布):
groups <- 2
N <- 500
alpha <- 0.05
PV <- 0.008950899
ncp <- NA
df1 <- groups - 1
df2 <- N - groups
#mean F
PV/df1 / ((1-PV) / df2)
> 4.497807
#estimated Non-Centrality Parameter
ncp <- (df2 - 2) * PV / (1-PV) - df1
> 3.479744
#estimated statistical power
F_crit <- qf(1-alpha, df1, df2) #critical F value
1 - pf(F_crit, df1, df2, ncp=ncp)
> 0.460971
方法1背后的代数(用于估计非中心性参数):
。
最后一个等于来自wikipedia的地方。
。