我对p值的概念感到困惑。一般来说,如果p值大于α,通常为0.05,我们就不能拒绝零假设,如果p值小于α,我们就会拒绝零假设。据我了解,如果p值大于alpha,两组之间的差异只是来自抽样误差或偶然。所以一切都还好。但是,如果p值小于alpha,结果具有统计显着性,我认为它统计上不显着(因为,如果p值较小比alpha我们拒绝原假设)。
基本上,如果结果具有统计显着性,则拒绝原假设。但是,如果假设具有统计显着性,那么如何拒绝该假设?从"具有统计意义的"这个词,我明白结果是好的。
答案 0 :(得分:4)
你误解了重要性在p值方面意味着什么。
我将尝试解释如下:
让我们假设一个关于两个人口平等的手段的测试。我们将进行t检验,通过从每个群体中抽取一个样本并计算p值来测试它。
零假设和替代方案:
H0: m1 - m2 = 0
H1: m1 - m2 != 0
这是一个双尾测试(尽管对此并不重要)。
我们假设您得到的{p值为0.01
且您的alpha值为0.05。 p值是当从两个群体(m1和m2)采样时平均值相等的概率。这意味着平均值有1%的概率相等,换句话说,100个样本对中只有1个平均差异为0.
这两种方法相等的低概率使我们有信心(使我们确定)人口的均值不相等,因此我们认为结果具有统计显着性。
让我们认为结果重要的门槛是多少?这由显着性水平(a)决定,在这种情况下为5%。
p值低于显着性水平使我们认为结果是显着的,因此我们确信我们可以拒绝零假设,因为NULL假设的真实概率非常低。
我希望现在有意义!
答案 1 :(得分:0)
让我举一个我经常与学生一起使用的例子,以阐明无效假设,阿尔法和重要性的概念。
假设我们正在玩一轮扑克。我发牌,我们下注。嘿,幸运的我!我的第一只手就红了。您诅咒您的运气,我们再次交易。我得到另一个同花顺并获胜。另一回合,我又得到4个A:这时您踢桌子并给我作弊:“这是bs!您想抢我!”
让我们用概率来解释一下:第一手牌有可能会出现同花顺:任何人都可以幸运。连续两次幸运的可能性较小。终于有可能连续三回获得真正的幸运。但是对于第三张镜头,您要说:“您如此幸运的概率太小了。我拒绝您只是幸运的想法。我称呼您为骗子。”也就是说,您拒绝了原假设(即什么也没有发生的假设!)
在所有情况下,零假设都是:“我们正在观察的这件事是随机性的影响”。在我们的示例中,原假设表明:“我只是一个接一个地得到所有这些好手,因为我很幸运”
p值是与事件关联的值,假设事件是随机发生的。您可以计算出正确洗牌后获得好手牌的几率。举例来说:如果我扔了20枚硬币,那么我连续获得20个硬币的机会就是1 /(2 ^ 20)= 0.000000953(非常小)。那是连续20个头的p值,扔了20次。
“具有统计意义的意义”是指“此事件似乎很奇怪。偶然发生的可能性很小。因此,我将拒绝原假设。”
Alpha或临界p值是您“踢桌子”并拒绝原假设的魔点。在实验性应用程序中,您可以预先定义该值(例如,alpha = 0.05)。在我们的扑克示例中,您可以在三只幸运手之后或在十二只中的十只之后叫我作弊者,依此类推。这是概率的阈值。
答案 2 :(得分:0)
可以确定 p值,您至少应该了解无效假设和替代假设 空假设意味着以我们有2朵花为例,这表示它们之间没有显着差异 而另一种假设是说它们之间有显着差异
是的,大多数数据科学家认为p值的显着性值为0.05,但这是基于研究(显着性水平的值) 0.5 0.05 0.01 0.001 可以作为p值
好吧,现在您已经掌握了p值,但是下一步该怎么做
如果模型的p值是0.03,而显着值是0.05,则必须采取,因此您必须拒绝原假设,这意味着2朵花或所述简单花之间存在显着差异
模型的p值<显着高于拒绝水平
,并且您的模型p值大于显着性假设将要接受的重要水平。