power.prop.test中的默认功率应该是多少?

时间:2018-08-28 16:35:49

标签: r stat ab-testing abtest

power.prop.test的电源部分是否有行业标准?

我正在使用该函数查找p2,但不确定电源的标准是什么。

power.prop.test(
  n= 6289195,
  p1=0.004, 
  power=0.8, 
  sig.level=0.05, 
  tol=.Machine$double.eps^.8)

例如,它应该是0.8还是0.9

1 个答案:

答案 0 :(得分:2)

这是一个实际的统计问题,而不是R问题,但通常是0.8的幂,即80%。由于它很普遍(就像95%的置信度一样),因此人们认为他们理解它在说什么,而不是像其他价值观那样去质疑它的选择。

您需要记住,它是一个任意目标:如果在示例中对其进行了更改,则主要影响是为p2提供不同的结果。确实,您应该明确地在增加样本量的成本与I型错误和特定II型错误的不同费用之间进行权衡

常见的参考是Cohen J.(1988)。 行为科学的统计功效分析。纽约,纽约:Routledge Academic,第2.4节,其中说:

  

这里建议作为惯例,当研究者没有其他依据来设置期望的功率值时,使用值.80。这意味着b设置为.20。提供这种任意但合理的值有几个原因(Cohen,1965,pp.98-99)。其中的首长考虑了.05的隐式约定。选择.20的b的想法是,这两种错误的一般相对严重性约为.20 / .05,即类型I的错误的严重性是类型II的四倍。错误。提供此.80期望的功率约定,希望当研究人员在其特定研究调查中为自己的实质性担忧选择“临时”值时,将忽略该约定。

在快速搜索中找到的0.8的其他示例:

  • R stats reference page for power.prop.testpower=0.8为例
  • 一个University of Ottawa medicine page说:“通常选择80%的功率;因此20%的时间会错过真正的差异。这是一个折衷方案,因为将功率提高到90%需要增加功率。样本量大约增加了30%”
  • Statistics Done Wrong网站和书上说,“ ”一位科学家可能想知道需要多少患者来测试一种新药能否使生存率提高10%以上,因此快速计算统计功效将提供答案。当统计功效为0.8或更高时,科学家通常会感到满意,这意味着有80%的机会得出真正的效果;但是,很少有科学家进行过这种计算,很少有期刊文章提到他们的统计功效。测试。”