比较两个样本测试

时间:2016-03-01 10:29:46

标签: statistics resampling chi-squared

从拥有10种鸟类的种群中抽取1000只鸟,预期结果是每种类型100只鸟(这是为了简单起见;一般情况下每个分布有概率Pi,其中i = 1 ... 10) 。

现在我已经编写了一个计算机程序来随机抽样1000个数字(读取鸟类),每种类型具有相同的概率(或概率Pi,其中i = 1 ... 10一般情况下)

假设期望的结果是E,并且在任何程序运行期间观察到的结果是S.现在为该程序编写单元测试用例,我进行了Chi-Squared测试以比较S到E并断言p值Chi统计量大于0.05。我已经在一个循环中声明了这个n(比如说100次)。

期望n个p值中的每一个> 0.05,这是不正确的。所以断言""的平均值是个好主意。 n p值> 0.05。

更一般地说,这里设计测试的正确方法是什么。

1 个答案:

答案 0 :(得分:0)

你的问题对我来说并不完全清楚,但是我没有足够的声誉来发表评论以便澄清,所以我会尽我所能,鉴于我的理解。你必须记住的是,p值是一个条件概率。具体来说,观察结果的可能性至少与我们在零假设为真的情况下看到的一样极端。

在您的模拟中,您已强制null为真(预期结果与您正在测试的声明相同:每种类型100只鸟)。 p值在零假设下具有均匀分布,因此模拟的平均p值理论上为0.5。